就在昨日,全球最大的代码托管平台GitHub再次陷入了一场严重的服务中断,这直接影响了全球数百万开发者的工作,也再次引发了人们对这个程序员必备工具稳定性的担忧。
Github昨日严重宕机
有网友吐槽到:GitHub 倒下了,但至少独角兽看起来也挺有个性的。
更有看热闹不嫌事儿大的网友吐槽到,X才是真正的实时监测,什么平台出了什么问题都是X最先发现,前不久OpenAI宕机就是个例子,比官方发公告还快!
据GitHub官方状态页面显示,问题始于昨日下午,源于一次"数据库基础设施相关的变更"。这次变更引发了连锁反应,导致GitHub的主要网站无法访问,同时影响了包括pull requests、GitHub Pages、Copilot在内的多项核心服务。对于那些依赖GitHub进行日常开发工作的团队来说,倒是可以光明正大的摸鱼(耽误进度)了。
Github全线崩盘
"就在我准备提交一个关键的pull request时,整个系统突然宕机了,"一位不愿透露姓名的硅谷开发者表示,"这让我们整个团队的工作陷入了停顿。"
GitHub迅速采取了应对措施,在意识到问题的严重性后,决定回滚那次引发问题的数据库变更。经过几个小时的努力,到了晚间,GitHub终于宣布其服务已经"完全恢复运行"。
目前Github已可以正常使用
在服务中断风波平息之际,一个名为ArtiPACKED的新安全漏洞被发现,这进一步加剧了GitHub的挑战。这个漏洞存在于GitHub Actions的artifacts功能中,可能导致存储库被接管,甚至使组织的云环境面临风险。
先宕机,然后又发现了新漏洞ArtiPACKED
ArtiPACKED漏洞的危险之处在于,它可能导致敏感令牌的泄露,包括第三方云服务的令牌和GitHub自身的令牌。这意味着恶意行为者可能获得未经授权的存储库访问权限,更严重的是,他们可能借此污染源代码,并通过CI/CD工作流将恶意代码推送到生产环境。
早在2012年,当GitHub还是一个新兴平台时,就曾经历过长达24小时的服务中断。那次事件在当时被认为是GitHub历史上最严重的一次宕机,也是促使公司大幅投资升级基础设施的一个转折点。
2012年Github宕机,被TechCrunch报道
面对昨日的宕机事件,GitHub的快速响应值得肯定。然而,这一事件也凸显了在实施重大基础设施变更时进行更严格测试的必要性。正如一位业内专家指出的:"在当今的云计算时代,即使是最微小的变更也可能引发灾难性的后果。公司需要更加谨慎,建立更加健全的测试和回滚机制。"
Github的响应速度还是很快的
对于依赖GitHub的开发者和组织而言,这次事件提醒我们,即使是最成熟的技术平台也可能出现问题。因此,制定应急预案、多样化代码存储策略变得越发重要。随着我们越来越依赖云服务和自动化工具链,如何在保持高效性的同时确保系统的稳定性和安全性,成为了一个迫切需要解决的问题。
各式各样的代码托管平台
尽管GitHub在过去的十多年里取得了巨大进步,从一个小型创业公司发展成为微软旗下的行业巨头,但这次事件表明,在技术世界中,没有一劳永逸的解决方案。每一次危机都是一次学习和改进的机会。对于GitHub来说,这次宕机事件是一次严峻的考验。
但如果公司能够汲取教训,进一步加强其基础设施的可靠性和安全性,那么这次危机或许能成为推动GitHub更上一层楼的契机。毕竟,在日益复杂的数字世界中,只有不断学习、适应和创新,才能构建更安全、更可靠的系统。
往 期 文 章