全球各地的企业现在可以利用这一全新参考架构来构建高性能、可扩展、安全的数据中心。
随着世界从通用计算转向加速计算,找到构建大规模数据中心基础设施的方法变得至关重要。为了支持这些全新的 AI 工作负载,企业在构建基础设施时不得不在未知的领域进行摸索。
模型的功能和软件框架在不断发展,加上这些工作负载是全新的,这意味着人们仍处于摸索最佳做法和标准化方法的起步阶段。持续的发展变化使得企业难以制定长期战略,也难以充满信心地投资建设基础设施。
为了应对这些挑战,NVIDIA 推出了企业参考架构(NVIDIA Enterprise RA)。这些全面的设计蓝图将帮助 NVIDIA 的系统合作伙伴和客户建立自己的 AI 工厂(即用于生产智能的高性能、可扩展、安全的数据中心)。
打造 AI 工厂以推动企业增长
针对新式的 AI 工作负载,NVIDIA 企业参考架构会提供全栈硬件和软件的推荐,以及最优的服务器、集群和网络配置的详细指导,从而帮助企业在设计 AI 工厂时避免设计和规划缺陷。
这些企业参考架构为构建灵活且经济的加速基础设施提供了简化的方法,同时确保兼容性和互操作性,从而降低了部署 AI 基础设施解决方案所需的时间和成本。
每个企业参考架构都包括涉及如下事项的推荐:
基于优化的 NVIDIA 认证系统服务器配置构建的加速基础设施,它们采用最新的 NVIDIA GPU、CPU 和网络技术,均经过测试和验证可以大规模地提供高性能。
通过 NVIDIA Spectrum-X AI 以太网网络平台和 NVIDIA BlueField-3 DPU 实现 AI 优化的网络,可在多个设计点提供峰值网络性能和最佳网络配置指导,从而满足不同工作负载和规模需求。
用于生产级 AI 的 NVIDIA AI Enterprise 软件平台,其包括可用于轻松构建和部署 AI 应用的 NVIDIA NeMo 和 NVIDIA NIM 微服务,以及用于基础设施配置、工作负载管理和资源监控的 NVIDIA Base Command Manager Essentials。
NVIDIA 多年来在设计和构建大型计算系统方面积累了丰富的专业知识,在此基础上开发了这套企业参考架构。通过在基于这些参考架构的合作伙伴解决方案上部署 AI 工作负载,企业将受益于:
加快产品上市:通过使用 NVIDIA 的结构化方法和推荐的设计方案,企业可以更快部署 AI 解决方案,从而在更短的时间内实现商业价值。
高性能:采用经过测试和验证的技术,确保 AI 工作负载在运行时保持最高性能。
可扩展性和可管理性:采用最佳的设计实践来开发 AI 基础设施,从而实现了高灵活性和可扩展性,并有助于确保最佳的网络性能。
安全性:AI 基础设施根据零信任理念进行设计,支持机密计算并且针对最新的网络安全 AI 创新进行了优化,可以安全地运行工作负载。
降低复杂性:采用最适合 AI 工作负载的服务器、集群和网络配置,从而加快部署时间,同时避免设计和规划缺陷。
获取方式
用户可以从 NVIDIA 的全球合作伙伴那里获取基于 NVIDIA 企业参考架构的解决方案,包括戴尔科技、HPE、联想和超微。
点击“阅读原文”,了解有关 NVIDIA 认证系统和 NVIDIA 企业参考架构的更多信息。