数字化监控平台稳定性保障实践

科技   2024-11-14 06:49   广东  


设立系统稳定性目标要考虑的3个因素:
第一个,成本因素。可用性越高,相应付出的成本就越高。比如为了更高的可用性,要有更多的冗余资源投入,甚至要做主备、双活甚至是多活。
第二个,业务容忍度。稳定性怎么设定,很大程度上还要取决于业务上的容忍度。对于核心业务或核心应用来说,当然是希望成功率越高越好,一般对系统稳定性要求是3 个9或4 个 9。因为这些系统一旦出问题,就会直接影响整个网站和公司的收益,这些都是钱,所以对稳定性要求必然就会提高。但是,对于非核心业务或应用,比如商品评论,商品评分等,或许”2 个 9”也能容忍。因为短时间的评论看不到,并不会对业务收入和用户体验造成太大的影响。
第三个,系统当前的稳定性状况。结合系统的实际情况,定一个合理的标准比定一个更高的标准会更重要。比如,如果系统可用性是低于 99% 的,那首先第一步是不是可以做到 99%,然后再争取做到 99.5%,再到 99.9%,一步一步朝着更高的标准迈进。同时,这样做也会更容易落地,因为你如果定一个太高的目标,又始终达不成,反而会打击到团队的自信心和积极性。

对于一个动态演进的系统而言,我们没有办法将故障发生的概率降为0,能做的只有尽可能的预防和缩短故障时的恢复时间。当然我们也不用一味的追求可用性,毕竟提升稳定性的同时,维护成本、机器成本等也会跟着上涨,所以需要结合系统的业务SLO要求,适合的才是最好的。



长摁二维码图片自动识别并下载本文


编码22331281195 
类型pdf
页数22
大小2MB
长摁二维码图片自动识别并下载本文文档

相关文档推荐


回复 文档编码 或者 长按文档封面识别二维码 获取对应文档

22331281178

大规模互联网系统SRE稳定性实践

22331281133

面向故障场景的稳定性建设

22331281122

信息系统稳定性保障能力建设指南

22331281164

基于1510的业务稳定性治理和故障应急实践

22331281147

数字化监控平台可观测稳定性保障实践

22331281030

数字化监控平台系统安全生产保障体系建设实践

回复 文档编码 或者 长按文档封面识别二维码 获取对应文档



回复以下 关键字 获取更多关联文档

SRE 稳定性 可靠性 可观测性

相关文章推荐

最近比较受欢迎的文章

说明:本文部分文字与图片资源来自于网络,分享此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即后台留言通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意。


CIO之家
找IT方案 就上CIO之家 www.ciozj.com IT人必备公众号
 最新文章