我们偶尔会听到某个系统是"X个9"的保障级别,这是什么意思?
它衡量的是系统高可用标准,"X个9"表示在系统1年时间的使用过程中,可以正常使用时间和总时间(1年)之比,"X"代表数字3-5",不同的"X",存在系统可靠性的差异。
(1)3个9,即99.9%,(1-99.9%)*365*24=8.76小时,表示该系统在连续运行1年时间里最多可能的业务中断时间是8.76小时。
(2)4个9,即99.99%,(1-99.99%)*365*24=0.876小时=52.6分钟,表示该系统在连续运行1年时间里最多可能的业务中断时间是52.6分钟。
(3)5个9,即99.999%,(1-99.999%)*365*24*60=5.26分钟,表示该系统在连续运行1年时间里最多可能的业务中断时间是5.26分钟。
越重要的系统,要求的9会更多,因为它可以保证更高的系统可用度。虽然4个9和5个9,只相差0.009%,业务中断时间则相差了10倍,为达到这个要求,就需要相应配套的支持,例如架构上,集群还是双机,自动还是手动进行应急切换,都需要更精细的系统设计和更高的保障机制,所以还得结合实际的场景和需求,确定相应的保障级别。
之所以"X"是3-5,我们可以看下X是1、2和6的情况,
(1)1个9,即90%,(1-90%)*365=36.5天。
(2)2个9,即99%,(1-99%)*365=3.65天。
(3)6个9,即99.9999%,(1-99.9999%)*365*24*60*60=31秒。
其中,1个9和2个9的业务中断时间以天衡量了,可靠性水平太低,6个9中断时间是31秒,如果要达到,可能付出的成本会很高,有些不切实际(特殊场景除外),因此这几种情况,一般不做参考。
参考资料,
https://cloud.tencent.com/developer/news/160525
如果您认为这篇文章有些帮助,还请不吝点下文章末尾的"点赞"和"在看",或者直接转发朋友圈,





