一句话总结:能放在你桌面上的个人AI超级计算机
NVIDIA 今天在CES 2025大会上发布了 NVIDIA Project DIGITS,这是一款能放在你桌面上的个人AI超级计算机。
将传统上需要大型数据中心才能完成的 AI 计算,带到每个人的桌面。
提供经济高效的计算解决方案,支持从小型实验到大规模生产的整个开发流程。
Project DIGITS 的核心是一颗叫 GB10 Superchip 的芯片:
SoC设计:基于 NVIDIA Grace Blackwell 架构,集成 NVIDIA Blackwell GPU(搭载最新一代CUDA核心和第五代Tensor Cores)与高性能 NVIDIA Grace CPU,专为深度学习优化。
高效性能:在 FP4 精度下提供 1 PFLOP(每秒一千万亿次浮点运算)的计算性能。同时具有 20 个基于 Arm 架构的高效能核心,能耗低但性能强。。
能耗与存储:
有什么用?
本地开发与测试:允许开发者在本地环境中快速进行 AI 模型原型设计和实验。
云端扩展:本地开发的模型可以直接迁移到云端加速部署。
高效性能与成本:提供媲美大型数据中心的计算能力,但仅需少量成本和能耗。
多样化应用场景:支持深度学习、自然语言处理、计算机视觉等多个领域的 AI 应用。
适合谁用?
适合AI 研究人员、数据科学家、学生以及初创企业使用。
更容易上手:只需普通电脑的配置即可使用。
灵活性强:从本地开发到云端部署无缝衔接。
典型应用场景
AI研究与创新
开发和测试复杂的 AI 模型,如大规模语言模型(LLM)或生成式AI应用。
进行原型开发、模型微调和实验。
数据科学
使用 RAPIDS 和其他工具,快速处理和分析大型数据集。
加速数据清理、特征工程和建模工作。
教学与学习
面向高校和学生,提供负担得起的 AI 计算资源,支持 AI 教学和学习实践。
NVIDIA 提供丰富的软件生态,让用户能够快速开始开发和部署AI模型:
(1) 开发工具
NVIDIA NGC:提供一个全面的软件库,包含开发工具包(SDK)、框架和预训练模型。
NVIDIA NeMo:用于微调大型语言模型(LLM)的框架。
NVIDIA RAPIDS:用于加速数据科学工作流。
兼容常用框架:支持 PyTorch、Python 和 Jupyter Notebook 等流行工具。
(2) 部署支持
用户可以在本地开发模型,随后直接部署到 NVIDIA DGX Cloud 或其他加速的云和数据中心架构中,无需改动代码。
(3) 企业级支持
提供 NVIDIA AI Enterprise 软件,保障企业级安全性、支持和生产环境发布。
过去只有大企业或实验室才能用得起的AI计算能力,现在变成了普通开发者都能负担得起的工具。这意味着:
小团队或个人可以开发和测试自己的AI模型。
AI研究和创新的门槛大大降低。
售价:起步价为 3000美元,由 NVIDIA 和顶级合作伙伴联合发售。
可在 NVIDIA 官网注册获取通知
非常 🐂 P
一定要买个!
GeForce RTX 5090
规格参数:
CUDA 核心数:21,760
GeForce RTX 5080
规格参数:
CUDA 核心数:16,384
显存:16GB GDDR7
显存带宽:960 GB/s
GeForce RTX 5070Ti
规格参数:
CUDA 核心数:12,288
显存:16GB GDDR7
显存带宽:896 GB/s(相比 RTX 4070 Ti 提升 78%)
GeForce RTX 5070
规格参数:
CUDA 核心数:10,240
显存:12GB GDDR7
显存带宽:672 GB/s(相比 RTX 4070 提升显著)
Cosmos 包括生成式世界基础模型(WFMs)、高级视频标记器(tokenizers)、安全保障机制和加速视频处理管道。
该平台旨在通过生成逼真、基于物理的合成数据,帮助开发者大幅降低物理 AI 模型开发的成本。
可实现文本到世界、视频到世界的生成。
提供三种模型:Nano(低延迟边缘部署)、Super(高性能基线模型)、Ultra(高保真模型)。
通过18000万亿次 tokens 的训练,涵盖2000万小时的真实及合成数据。
Tokenizers 压缩效率提高 8 倍,处理速度提升 12 倍。
生成虚拟数据
雪天的驾驶环境 仓库中机器人的复杂操作
可以创建超逼真的虚拟场景,比如: 这些数据可用于训练 AI 系统,减少对真实世界数据的依赖。
Cosmos 的工具可以快速整理和标记大规模的视频数据,比传统方法快 10 多倍,节省时间和成本。
模拟不同天气和道路条件(雨天、雾天、拥堵)。 测试机器人在工厂或仓库里的行动能力。
可以在虚拟环境中测试机器人或自动驾驶系统,比如:
提供开源的基础模型,开发者可以根据自己的需求定制,用于机器人或自动驾驶技术。
用于自动驾驶训练:比如 Uber 和 Waabi 使用它来创建虚拟驾驶测试场景。 用于机器人研发:Agility 和 XPENG 使用它来训练和优化机器人操作。
现场展示的机器人公司:
国际
Apptronik:Apollo 机器人 Agility Robotics:Digit 机器人 NEURA Robotics:4NE-1 机器人 Figure:Figure 02 机器人 1X:NEO 机器人 Mentee:MenteeBot 机器人 Sanctuary AI:Phoenix 机器人
中国
宇树科技(Unitree Robotics):H1 机器人
智元机器人:远征 A2 机器人
星动纪元:Star1 机器人
银河通用:G1 机器人
傅利叶智能(Fourier Intelligence):GR-2 机器人
小鹏汽车:Iron 机器人
本次英伟达发布,将推进人工智能更加应用化,使得模型训练、微调进入消费级领域,同时也将推动AI应用、智能硬件和机器人大爆发!