近日,微软宣布了其Azure基础设施的一系列重大更新,包括专为数据中心设计的Azure Boost DPU、全新内部安全芯片Azure Integrated HSM,以及针对AI和超大规模系统需求的冷却与电源技术改进等。
这些定制设计的芯片计划在未来几个月内发布,以期解决现有数据中心面临的安全性和效率差距,进一步优化其服务器以应对大规模 AI 工作负载。微软此前已发布Maia AI 加速器和 Cobalt CPU,本次更新是该公司全面战略推进的又一大步,旨在重新思考和优化其堆栈的每一层(从硅片到软件),以支持先进的 AI。
Azure Boost DPU 是微软推出的首款内部研发的 DPU,专为Azure基础架构打造,是一种软硬件协同设计,可运行自定义的轻量级数据流操作系统。它将高速以太网和PCIe接口、网络和存储引擎、数据加速器以及安全功能集成到一个完全可编程的片上系统中。这一创新设计不仅整合了传统服务器的多个组件,还大幅提升了以数据为中心的工作负载的运行效率和功耗表现。
据微软称,与传统服务器相比,Azure Boost DPU功耗降低了三倍,性能提高了四倍。此外,基于 DPU 的系统添加了一个自定义应用程序层,该层利用 DPU 紧密集成的数据压缩、数据保护和加密引擎,为安全性和可靠性树立了新标准。但目前Azure Boost DPU 在哪些工作负载上更节能,究竟与哪些现有硬件相比它的速度更快?微软尚没有透露。
值得注意的是,Azure Boost DPU很可能源于微软去年12月收购的DPU制造商Fungible。据报道,微软以约1.9亿美元的价格收购了这家由前苹果和瞻博网络工程师创立的公司。收购完成后,Fungible团队已全面加入微软的基础设施工程部门。
DPU作为一种专用硬件,主要负责处理数据流量的安全性、网络路由等数据处理任务。它们能够减轻CPU和其他芯片在处理特定工作负载(如AI工作负载)时的负担,从而提升整体系统的性能和效率。过去几年,DPU 市场日益突出。Nvidia 于 2019 年推出其 BlueField 系列 DPU,AMD拥有自己的Pensando DPU。AWS 和谷歌等云服务提供商也在积极探索DPU技术的应用。
对于超大规模企业来说,DPU带来的效率提升极具吸引力。这些企业正在建设越来越大、耗电量越来越大的数据中心,以满足日益增长的AI需求。微软在2022年曾表示,由于其数据中心能耗的不断增长,能源成本将增加8亿美元。因此,DPU的应用将有助于降低数据中心的能耗和运营成本,提升企业的竞争力。
Nvidia首席执行官黄仁勋认为,CPU、GPU和DPU将共同构成数据中心的基础,CPU负责一般处理任务,GPU为加速计算提供动力,而DPU则负责管理数据流。随着DPU市场的不断发展壮大,预计到2031年,DPU芯片的市场价值将达到55亿美元。
去年,在Ignite大会上,微软凭借其针对人工智能任务和生成式人工智能优化的Azure Maia AI加速器,以及专为在Microsoft Cloud上运行通用计算工作负载设计的基于Arm的Azure Cobalt CPU,赢得了业界的广泛关注。如今,微软再次迈出重要步伐,扩展了其定制硅片产品组合,在安全性和效率方面取得了显著进展。
微软推出的全新内部安全芯片Azure Integrated HSM配备了专用的硬件安全模块,并严格遵循FIPS 140-3 3级安全标准设计。据Azure基础设施营销副总裁Omar Khan介绍,Azure Integrated HSM在本质上强化了密钥管理,确保加密和签名密钥在芯片范围内保持安全,同时不会牺牲性能或增加延迟。
Azure Integrated HSM充分利用了专用硬件加密加速器,直接在芯片的物理隔离环境中执行安全、高性能的加密操作。与传统HSM体系结构相比,该芯片无需进行网络往返或密钥提取,即可在其专用硬件边界内完成加密、解密、签名和验证等关键操作。
微软表示,从 2025 年开始,它将在微软数据中心的每台新服务器中安装 Azure Integrated HSM 安全芯片。Azure Integrated HSM 与整个 Azure 安全堆栈配合使用,可提供深度端到端安全性。
Azure Integrated HSM 是微软继Pluton之后推出的第二款安全芯片,Pluton 是一款内置于英特尔、AMD 和高通处理器中的面向消费者的芯片。除了微软,AWS 和 Google Cloud 也构建了自己的内部安全芯片。AWS 的 Nitro 安全芯片和 Google Cloud 的 Titan功能范围各不相同,但基本概念是相同的:为使用其服务的数百万用户提供完全安全的操作和数据环境。
定制芯片可以提高安全性,但并不是万能的。2020 年,研究人员发现 Apple 的 T2 安全芯片中存在一个“无法修复”的漏洞,这可能会让 Mac 面临安全威胁。目前微软没有提供有关 Azure Integrated HSM 漏洞测试的详细信息,但希望随着芯片的临近发布,微软会提供详细信息。
参考:
https://techcommunity.microsoft.com/blog/azureinfrastructureblog/enhancing-infrastructure-efficiency-with-azure-boost-dpu/4298901
https://venturebeat.com/data-infrastructure/microsoft-debuts-custom-chips-to-boost-data-center-security-and-power-efficiency/
https://www.datacenterknowledge.com/cloud/microsoft-ignite-2024-new-azure-data-center-chips-unveiled
https://techcrunch.com/2024/11/19/new-in-house-chips-round-out-microsofts-portfolio/
【投稿】:SDNLAB原创文章奖励计划