历史记录!甲骨文豪掷13万块Blackwell GPU,打造全球最大的算力集群。总投资200亿美元。

科技   2024-09-14 20:16   江苏  


Oracle,全称甲骨文,是全球领先的信息管理软件及服务供应商,总部位于美国加利福尼亚州的红木城。公司成立于1977年,Oracle的主营业务是数据库管理系统,其开发的Oracle数据库产品因性能卓越而闻名,被广泛应用于各行各业,特别是被财富排行榜上的前1000家公司以及众多大型网站所采用。除了数据库管理系统外,Oracle还提供了一系列的企业软件解决方案,涵盖企业资源计划、客户关系管理、供应链管理,帮助企业提高管理效率、降低成本并增加竞争力。


01/
OCI超级集群:云端AI性能的全新巅峰

131,072块英伟达Blackwell GPU


Oracle正酝酿其最新力作——OCI超级集群,重塑AI超级计算领域。不仅仅是一台普通的云超级计算机,是Oracle向未来AI时代坚定大基建。OCI超级集群算力巨擘,这台超级计算机将搭载前所未有的131,072块英伟达Blackwell GPU,这一数量不仅刷新了最新的记录,惊世骇俗的投资。如果这些GPU齐力并发,OCI超级集群的峰值性能预计将飙升至爆表的2.4 zettaflops,也就是说每秒超过十万亿亿次的计算能力,全球最顶尖的超级计算机也望尘莫及。这里的性能标准采用了FP8,之前有解释过,是专为AI优化,相较于传统的FP64计算,FP8在保证精度的同时,大幅提升计算效率。


02/
灵活与安全并重的云端AI服务

多元化配置与未来探索


OCI超级集群的雄心远不止于此。Oracle云基础设施执行副总裁Mahesh Thiagarajan自豪地表示:“我们提供的,不仅仅是市面上最广泛的AI基础设施产品,更是对云端最苛严AI工作负载的全面支持。通过Oracle的分布式云,客户可以随心所欲地在全球任何角落部署云和AI服务,同时确保数据与AI主权的安全无虞。”这种灵活性与安全性的结合,为企业在全球范围内开展AI业务提供了强有力的支持。



为了满足不同客户的需求,OCI超级集群还精心设计了多种配置方案。从搭载英伟达H100 GPU的小型集群,到扩展至65,536块H200 GPU的中型集群,再到最终形态的Blackwell GPU巨阵。特别是配备英伟达GB200 NVL72液冷裸机实例的超级集群,通过NVLink和NVLink Switch技术,实现了72块Blackwell GPU在单一域内以129.6 TBps的带宽无缝互联,关于OCI超级集群的具体部署地点虽然保持神秘,已有多家企业提前享受到了这一先进基础设施带来的红利。


03/
Oracle的宏伟蓝图与可持续发展

已拥有162个运营中或在建的云数据中心


公司创始人Larry Ellison近日透露,Oracle在全球范围内已拥有162个运营中或在建的云数据中心,其中最大规模的数据中心容量已高达800兆瓦,并计划进一步打造千兆瓦级别的数据中心,由创新的模块化核反应堆提供绿色动力。这次OCI超级集群的诞生,不仅是对现有AI超级计算机的一次全面超越,更是对未来AIg时代的一次深情呼唤。它将以无与伦比的计算能力、灵活高效的服务模式以及安全可靠的数据主权保障,引领全球AI产业基建迈向新的高度。


© THE END 

转载请联系本公众号获得授权

AI科技之窗
全网最懂AI的科技博主!200万科技爱好者都关注的公众号。全面解读全球AI新闻。未来是人工智能提升生产效率的时代,2024年AI­GC,智能驾驶,量子计算机,万物互联,虚拟现实等等应用爆发的一年,当下正在经历第四次科技革命。
 最新文章