谷歌云计算，用了哪些芯片？

文摘 2024-11-06 10:11 安徽

👆如果您希望可以时常见面，欢迎标星🌟收藏哦~

来源：内容编译自hpcwire，谢谢。

谷歌云计算正在迎来大量硬件，该公司正在进行重大升级，准备在明年将 Nvidia 的 Blackwell GPU 纳入旗下。

10 月下旬宣布的升级包括其名为 Trillium 的新 TPU、自主研发的 Axion CPU 和 Nvidia 的新 H200 GPU 的预览。

新硬件被输入到谷歌的“超级计算机”中，这是一台遍布谷歌云基础设施的大型超级计算机。它包括一套适用于多种工作负载的多样化软件和芯片产品。

谷歌在系统和软件层面重新考虑了其基础设施，为硬件和软件提供了一个通用层。

这也催生了谷歌的超级计算机，它支持传统计算和现代计算。它融合了计算、网络、存储和软件，以满足不同的 AI 和 HPC 消费模式。

谷歌副总裁兼计算和人工智能基础设施总经理 Mark Lohmeyer 在一篇博文中表示，该公司在 10 月下旬还分享了人工智能超级计算机的概念，它“集成了工作负载优化的硬件（TPU、GPU 和 CPU）、开放软件和灵活的消费模型，为最先进的人工智能模型提供支持”。

Lohmeyer 对 Google Cloud 运作方式的技术愿景类似于 Google 公司的精神——欢迎所有硬件和软件，为其提供用户友好的工具，并提供一系列消费选项。

一款名为 Hypercompute Cluster 的新产品就是按照这个思路建立起来的，它是一种高度可扩展的集群系统。超级计算领域正在努力平衡传统的高精度计算和人工智能猜测，因此 Hypercompute Cluster 处理各种工作负载的能力可以弥补模拟和科学计算之间的差距。

Lohmeyer 表示，该集群将结合谷歌的人工智能基础设施技术，“无缝部署和管理大量加速器作为一个单元”。

密集托管功能将多个资源聚集在一起，吞吐量高，因此工作负载可以快速可靠地完成。此功能对于科学计算和 AI 都很重要。

Google 的目标是为超级计算机所执行的任务提供保障。例如，Google 希望通过其消费模型为时间和结果带来可靠性和灵活性。

在软件和硬件层构建硬件和虚拟化层可能很复杂，但 Google 可以通过在 Google Cloud 上进行预配置部署的单一 API 调用使其变得简单。

科学家可以选择一个环境，将集群部署到 Google Cloud，并选择节点数量、CPU 或 GPU 核心以及内存。

Lohmeyer 解释说：“这包括具有框架和参考实现的容器化软件（例如 JAX、PyTorch、MaxText）、编排（例如 GKE、Slurm）以及流行的开放模型（例如 Gemma2 和 Llama3）。”

此功能使 HPC 堆栈的部署变得更容易，因为部署 HPC 堆栈可能相当复杂，因为它们涉及管理硬件和软件。借助 Google Cloud 管理硬件和软件资源，具有技术知识的创意科学家可以确定使用开源 AI 模型补充科学计算的方法。

当全世界都在追求 Nvidia GPU 时，谷歌也为客户提供了更快速、更具成本效益的替代方案来完成他们的 AI 工作。

Google 将 Trillium TPU 添加到其云产品中，该产品现已推出预览版。在 Google I/O 大会上发布的 Trillium TPU 可以扩展到大规模集群，为 Nvidia GPU 提供替代方案，用于训练 AI 模型并缩小规模以进行推理。Trillium 是 TPUv5 产品的后继者。

Trillium 芯片将能够运行继当前 Gemini 大型语言模型之后的 AI 模型。谷歌声称，通过比较 BF16 与 Cloud TPU v5e 的每芯片峰值计算性能，Trillium 的速度提高了 4.7 倍。

Trillium 芯片拥有下一代 HBM 内存，但谷歌并未具体说明它拥有的是 HBM3 还是 HBM3e，Nvidia 在其 H200 和 Blackwell GPU 中使用了后者。TPU v5e 上的 HBM2 容量为 16GB，因此 Trillium 将拥有 32GB 的容量，HBM3 和 HBM3e 均有提供。HBM3e 提供最大的带宽。

服务器舱可承载 256 个 Trillium 芯片，AI 芯片的通信速度将比类似的 TPU v5 舱设置快 2 倍。这些舱可排列成更大的集群，并通过 Jupiter 光路交换网络结构进行通信，该结构可提供 400 Gb/s 的带宽。

谷歌还增加了其自主研发的 Axion CPU，该公司表示，与同类当前基于 x86 的通用工作负载实例相比，该 CPU 可提供“高达 65% 的性价比和高达 60% 的能效”。

Axion CPU 基于 ARMv9 架构和指令集。

Axion 融入了名为 Titanium 的核心基础设施技术，该技术通过各种技术承担大部分计算工作负载，包括定制硅片、网络、基础设施处理单元和块存储。这些技术减轻了 AI 加速器和 CPU 的负载。

Titanium 也得到了升级。谷歌宣布推出搭载 Nvidia H200 Tensor Core GPU 和全新 Titanium ML 网络适配器的 A3 Ultra VM，该适配器经过优化，可为“AI 工作负载提供安全、高性能的云体验”，谷歌表示。

谷歌发言人在一封电子邮件中表示，Titanium ML 网络适配器“包含并构建在”Nvidia 的 ConnectX-7 NIC 上，当与数据中心范围的 4 向轨道对齐网络集成时，可以通过 RoCE 提供 3.2 Tbps 的 GPU 到 GPU 流量。

谷歌在一封电子邮件中表示，超级计算集群将从 A3 Ultra VM 开始提供。

Google Cloud 的理想情况是客户启动 AI 工作负载，从而充分利用多个加速器。然而，该公司在一封电子邮件中表示，本周宣布的 Titanium 更新并未实现 TPU-GPU 互操作性。

Google Cloud 升级是 Nvidia Blackwell GPU 的预热，该 GPU 将于明年加入 Google 的云服务。Google 正在将其自己的“Gen4”液体冷却技术引入 GB200 服务器托盘，但 Google 尚未透露太多细节。

包括 AWS 和微软在内的竞争对手都拥有自己的 AI 基础设施，其中包括自主研发的 CPU 和 AI 加速器。各大公司正投资数十亿美元建立 AI 大型数据中心。

参考链接

https://www.hpcwire.com/2024/11/05/google-cloud-sporting-a-new-look-in-hpc-and-ai-hardware/

END

👇半导体精品公众号推荐👇

▲点击上方名片即可关注

专注半导体领域更多原创内容

▲点击上方名片即可关注

关注全球半导体产业动向与趋势

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3938内容，欢迎关注。

推荐阅读

『半导体第一垂直媒体』

实时专业原创深度

公众号ID：icbank

喜欢我们的内容就点“在看”分享给小伙伴哦

http://mp.weixin.qq.com/s?__biz=Mzg2NDgzNTQ4MA==&mid=2247762634&idx=8&sn=4bcacc59e3aa7a84d4adb17bae02b846

半导体行业观察

半导体深度原创媒体，百万读者共同关注。搜索公众号：半导体芯闻、半导体产业洞察，阅读更多原创内容

最新文章

后摩尔时代光计算芯片成破局关键，国产厂商大有可为！

自研DPU发布：微软芯片，火力全开

丹麦机器人巨头，邀您一起“搞事”

英伟达发布迄今最大的“芯片”

英特尔下一代AI芯片，首次曝光

特斯拉也在抢购HBM 4

美国大幅资助这项半导体技术

台积电2nm太猛了，联电太惨了

EUV光刻机争夺战，风云突变

AMD，杀疯了

亚洲疯狂投资芯片

台积电到处买厂，大力扩产

美国两大芯片公司，同时换帅

全球半导体设备巨头，都不好

开源软件，陷入危机

ASML，最新分享

台积电先进制程：加速赴美，10座工厂同时开建

Chiplet，十年展望

英伟达最新GPU，碰到问题了

Wi-Fi 5、6、7 ，有什么区别？

AMD CPU销量，惊人增长

寻找GaN的替代品

OpenAI曾想收购Cerebras

芯片行业，惊弓之鸟

苹果芯片，成功的秘诀

USB诞生背后的故事

芯片设备，面临风险

用全球最大芯片打造超算，细节曝光

分析师：三星短期内复苏可能性不大

英伟达取代英特尔的原因

钻石冷却GPU即将问世

WiFi 8，要来了！

中国10月份芯片产量放缓

100000块Nvidia芯片，马斯克出手

石墨烯：正在从实验室走向产业化

美国“芯片法案”新补贴计划，敲定！

汽车市场放缓，欧洲汽车芯片制造项目面临暂停

揭秘超算Aurora，如何打造一台超级计算机？

台积电在美中台间走钢索

TSV，太贵了！

一家晶圆厂，改变了一座城

芯片太耗电，怎么办？

英伟达首颗Arm PC芯片，太猛了

高通这颗等了四年的芯片，终于来了

SK海力士DRAM，威胁三星？

悼念，BASIC语言的创始人去世

芯片设备巨头确认：市场疲软

免费听会 | 智己/翊杰/Solidigm/奕成/安似/AT&S等20+重磅嘉宾与您11.27相约苏州SiP China！

八英寸晶圆厂，何去何从？

北京大学FFET技术，开创全球三维集成新篇章

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉