不到半年,崩了两次,业务稳定性该如何保障?

科技   2024-08-20 19:09   广东  


NEWS 

8月19日下午,作为一款国民级在线音乐软件,网易云音乐“崩了”立刻登上微博热搜。随后,网易云音乐在微博发出第一条回应称,因基础设施故障,导致网易云音乐各端无法正常使用,正在加紧修复此番故障持续了2个小时之久。据内部技术人员处获悉,此次宕机事件或与今年二季度的机房搬迁有关。

实际上,这已经是今年网易云音乐第二次“崩了”。今年3月中旬,网易云音乐出现了登录状态突然失效、无法正常使用的情况,这一事件同样登上了热搜,网易云音乐客服其后确认是由于网络异常导致的,与版本更新无关。

对于网易云音乐而言,服务中断不仅是技术层面的挑战,或也对其品牌形象和用户信任造成影响。尤其在去年首次实现盈利的背景下,此次事故无疑给了网易云音乐当头一棒。


事实上,近两年来,互联网公司技术事故频发,几乎各大厂商都有遇到此类黑天鹅事件的经历。

2023年3月,唯品会南沙IDC冷冻系统故障,导致机房设备温度快速升高宕机,造成线上商城停止服务。此次事故影响时间持续12个小时,影响客户达800万。

2023年11月,滴滴因底层系统软件故障,造成了12小时的超长时间系统崩溃。滴滴外,阿里云在不到10天的时间里也出现了两次故障。

2024年5月,谷歌云服务由于“配置错误”导致澳大利亚 UniSuper 基金云订阅账户被删除,服务中断长达一周。

2024年7月,微软因背后的网络安全公司CrowdStrike技术更新,导致全球“蓝屏死机”重大IT故障。

……



这一系列“宕机”事件再次提醒我们,业务的持续运行依赖于稳定的IT基础设施,即便技术平台再先进、成熟,同样可能会出现因突发状况导致业务服务中断,长时间影响用户日常使用的事情,从而导致品牌口碑受损等;

为防患于未然,确保在突发情况下能够快速恢复业务,建立健全的应急机制,创建健康、稳定、高效、便捷的数据灾备解决预案显得尤为重要。这对于组织来说,也是一种相对低成本且高效的业务保护措施,能够一定程度上降低因灾难而造成的损失,从而保障组织的利益和声誉。


作为一直聚焦于灾备建设及深耕数据安全领域的技术型企业,数存科技一直致力于提供更优秀的灾备解决方案,帮助各行业用户解决因人为误删误改、软硬件故障等各类情形导致的业务宕机、数据丢失问题,协助用户构建完整的灾难恢复体系,实现数据安全的“可知、可视、可管、可控、可溯”,保障业务连续性。


统一管理与全面保护

从预防黑客攻击、病毒感染、数据完整性以及容灾体系流程化管理的角度考虑,需要进行一体化防护管理,其中包含操作系统、软件、数据、中间件等,建立一套完整的容灾体系,提供容灾资源、容灾策略、灾难恢复流程的统一监控管理,实现数据安全运维。


快速解决业务宕机问题

数存灾备系统均支持数据副本快速使用能力,任意时间点的历史副本均可直接使用,当发生系统宕机问题时,可以快速找到停摆点或历史的某个时间点,快速接管业务系统或找回数据,保障系统健康稳定运行。


灾难应急预案与便捷容灾演练

提供包含巡检以及灾难应急预案在内的模拟演练功能,可帮助用户实现设备运维、系统测试、演练等工作的开展,以此来检验备份系统及灾难恢复预案是否真实有效,同时锻炼信息团队应对灾难恢复时执行及运作能力。


数据迁移与安全性保障

提供自动化迁移策略,简化数据迁移过程,减少人工干预,提高迁移效率。基于便捷的数据恢复及验证,可在隔离但不封闭的验证网络中完成备份数据验证。同时提供灾难恢复验证服务,协助用户完善灾难恢复运营体系。


满足数据安全合规性要求

从企业数据安全与合规性出发,为企业提供数据全生命周期安全保障,帮助企业对数据进行分类和分级,实现对业务历史数据的对比分析、业务数据风险监测、灾难发生后处置响应以及事后的事件追溯等,满足《网络安全法》《数据安全法》《信息系统安全等级保护基本要求》等合规要求。


7×24小时技术支持

数存科技始终以用户为中心,拥有3大研发中心及1大运营服务中心,在深圳、广州、上海、北京、合肥、西安、长沙、成都、重庆、福州、厦门、昆明、贵阳、济南、南京、乌鲁木齐、兰州等地均设有本地化办事处及服务人员,服务网点遍布全国。数存团队始终坚持为用户创造更大价值,不仅能够提供定制化的灾备整体解决方案,还提供7×24小时技术支持服务,及时响应和解决客户需求,确保业务连续性。



—  推 荐 阅 读 —

数存科技
深圳数存科技,作为全球数据安全的领导者,专注于数据安全领域,致力于用户业务连续性建设,为用户提供全栈数据安全解决方案,携手用户构建实战化数据灾备应用体系。产品及解决方案广泛应用于政企医教、金融、交通、能源等行业,累计为10000+用户服务。
 最新文章