每个人都能买得起 英伟达发布个人AI超级计算机 能运行2000亿参数的大模型

文摘   2025-01-07 21:59   安徽  
今日发布

一句话总结:能放在你桌面上的个人AI超级计算机


NVIDIA 今天在CES 2025大会上发布了 NVIDIA Project DIGITS,这是一款能放在你桌面上的个人AI超级计算机。


  • 将传统上需要大型数据中心才能完成的 AI 计算,带到每个人的桌面。

  • 提供经济高效的计算解决方案,支持从小型实验到大规模生产的整个开发流程。


这个东西是干什么的?
Project DIGITS 提供了一个超强的AI计算工具,可以让普通用户在自己的电脑上完成:
Project DIGITS 采用全新的 NVIDIA GB10 Grace Blackwell Superchip,能够提供 1 PFLOP(每秒一千万亿次浮点运算)的AI计算性能。
设计用于原型开发、微调以及运行大型AI模型,使用户能够在本地桌面系统上开发和运行推理模型,然后无缝部署到云或数据中心
也就是它能在你的本地就能运行超大的AI模型,能够运行高达 2000亿 参数的大语言模型(比如...)。
而且支持在本地电脑上开发和测试AI模型,然后快速部署到云端或数据中心。
简单来说,它就像是给每个开发者配了一台袖珍的AI超级计算机!
就这个东西,比Mac mini还小

它的核心技术是什么?

Project DIGITS 的核心是一颗叫 GB10 Superchip 的芯片:

SoC设计:基于 NVIDIA Grace Blackwell 架构,集成 NVIDIA Blackwell GPU(搭载最新一代CUDA核心和第五代Tensor Cores)与高性能 NVIDIA Grace CPU,专为深度学习优化。

高效性能:在 FP4 精度下提供 1 PFLOP(每秒一千万亿次浮点运算)的计算性能。同时具有 20 个基于 Arm 架构的高效能核心,能耗低但性能强。。

能耗与存储:

只需要普通电源插座供电,不需要特殊的设备
配备 128GB 统一内存和 4TB NVMe 存储。
性能超强:可以运行非常复杂的AI任务,能处理 2000亿 参数的大语言模型。
可扩展性:通过 NVIDIA ConnectX 网络,两台 Project DIGITS 超级计算机连接起来,可以运行 4050亿 参数模型
连接性能:通过 NVLink-C2C 实现 GPU 和 CPU 高速互联。


有什么用,适合谁用?

有什么用?

本地开发与测试:允许开发者在本地环境中快速进行 AI 模型原型设计和实验。

云端扩展:本地开发的模型可以直接迁移到云端加速部署。

高效性能与成本:提供媲美大型数据中心的计算能力,但仅需少量成本和能耗。

多样化应用场景:支持深度学习、自然语言处理、计算机视觉等多个领域的 AI 应用。

适合谁用?

适合AI 研究人员、数据科学家、学生以及初创企业使用。

更容易上手:只需普通电脑的配置即可使用。

灵活性强:从本地开发到云端部署无缝衔接。

典型应用场景

AI研究与创新

开发和测试复杂的 AI 模型,如大规模语言模型(LLM)或生成式AI应用。

进行原型开发、模型微调和实验。

数据科学

使用 RAPIDS 和其他工具,快速处理和分析大型数据集。

加速数据清理、特征工程和建模工作。

教学与学习

面向高校和学生,提供负担得起的 AI 计算资源,支持 AI 教学和学习实践。



软件与生态支持

NVIDIA 提供丰富的软件生态,让用户能够快速开始开发和部署AI模型:

(1) 开发工具

NVIDIA NGC:提供一个全面的软件库,包含开发工具包(SDK)、框架和预训练模型。

NVIDIA NeMo:用于微调大型语言模型(LLM)的框架。

NVIDIA RAPIDS:用于加速数据科学工作流。

兼容常用框架:支持 PyTorch、Python 和 Jupyter Notebook 等流行工具。

(2) 部署支持

用户可以在本地开发模型,随后直接部署到 NVIDIA DGX Cloud 或其他加速的云和数据中心架构中,无需改动代码。

(3) 企业级支持

提供 NVIDIA AI Enterprise 软件,保障企业级安全性、支持和生产环境发布。

为什么重要?

过去只有大企业或实验室才能用得起的AI计算能力,现在变成了普通开发者都能负担得起的工具。这意味着:

小团队或个人可以开发和测试自己的AI模型。

AI研究和创新的门槛大大降低。

AI 计算的普及:通过降低硬件成本和部署难度,推动 AI 技术的普及。
创新驱动力:为个人和小型团队提供前所未有的计算能力,激发更多创新。
生态系统的整合:将 NVIDIA 的硬件与软件生态系统无缝结合,为用户提供一站式解决方案。

多少钱?什么时候能买到?
发售日期:2025年5月

售价:起步价为 3000美元,由 NVIDIA 和顶级合作伙伴联合发售。

可在 NVIDIA 官网注册获取通知


评价

非常 🐂 P

一定要买个!

于此同时
NVIDIA 推出了全新 GeForce RTX 50 系列显卡和笔记本电脑
这些产品基于 Blackwell RTX 架构,带来了革命性的性能提升和 AI 驱动的神经渲染技术。
RTX 50 系列提供高达 8 倍的性能提升(通过 DLSS 4)、高达 75% 的延迟降低(通过 Reflex 2),为游戏玩家和内容创作者开启了全新的可能性。

强大的 Blackwell 架构
包含 920 亿个晶体管,采用最新的 GDDR7 显存(速度高达 30Gbps),提供高达 1.8TB/s 的内存带宽。
新一代 Tensor 核心和光线追踪(RT)核心,支持实时渲染和更高效的 AI 模型处理。
DLSS 4 和 Reflex 2 的支持,提升游戏流畅度和响应速度。

GeForce RTX 5090

规格参数:

CUDA 核心数:21,760

显存:32GB GDDR7
显存带宽:1792 GB/s
Tensor 核心:680(第 5 代)
RT 核心:170(第 4 代)
主要性能提升:
性能是 RTX 4090 的 2 倍。
通过 DLSS 4 和 Multi Frame Generation,可支持 4K 分辨率、240 FPS 和全光追游戏。
支持生成式 AI 应用,图像生成速度提升 2 倍,同时显存占用减少(FP4 模式)。

价格:起售价 $1,999
上市日期:2025 年 1 月 30 日

GeForce RTX 5080

规格参数:

CUDA 核心数:16,384

显存:16GB GDDR7

显存带宽:960 GB/s


主要性能提升:

性能是 RTX 4080 的 2 倍。
可在 4K 分辨率下畅玩支持光追的游戏(如《赛博朋克 2077》和《Alan Wake 2》)、《黑神话:悟空》 等大作
满足创作者对 3D 渲染和视频编辑的高需求。

价格:起售价 $999
上市日期:2025 年 1 月 30 日

GeForce RTX 5070Ti

规格参数:

CUDA 核心数:12,288

显存:16GB GDDR7

显存带宽:896 GB/s(相比 RTX 4070 Ti 提升 78%)


主要性能提升:

性能是 RTX 4070 Ti 的 2 倍。
在 2560x1440 分辨率下,可高帧率运行光追游戏。

价格:起售价 $749
上市日期:2025 年 2 月

GeForce RTX 5070

规格参数:

CUDA 核心数:10,240

显存:12GB GDDR7

显存带宽:672 GB/s(相比 RTX 4070 提升显著)


主要性能提升:

性能是 RTX 4070 的 2 倍。
在 2560x1440 分辨率下,可高帧率运行光追游戏,支持 DLSS Multi Frame Generation。

价格:起售价 $549
上市日期:2025 年 2 月


下一代创新技术
DLSS 4 神经渲染技术
DLSS 4 是 NVIDIA 最新的神经渲染技术,由 GeForce RTX Tensor 核心驱动,可显著提升帧率的同时保持清晰的画质。
每个传统渲染帧可生成多达3个额外帧
帧率提升高达8倍
支持4K 240FPS全光线追踪游戏
首次在游戏中应用 Transformer AI 模型
改进的时序稳定性和运动细节


Reflex 2 帧变形技术
NVIDIA Reflex 2 通过全新的帧变形技术将游戏延迟降低高达75%,让游戏体验更加流畅。
将游戏延迟降低75%
同步CPU和GPU工作流程
基于最新鼠标输入更新渲染帧
为多人游戏提供竞争优势
让单人游戏更具响应性
NVIDIA ACE AI角色
NVIDIA ACE 是一套数字人物技术,通过生成式AI为游戏角色和数字助手注入生命力。
AI驱动的游戏角色行为
持续学习的敌人AI
自主行动的NPC系统
支持多款知名游戏
实时响应玩家行为
Project R2X PC数字人   
Project R2X 是一个基于视觉的PC化身,可以帮助用户处理日常任务和提供AI辅助。
R2X 提供一个基于视觉的虚拟化身,可作为用户的桌面助手。
它可以协助用户完成多种任务,例如读取和总结文档、管理应用程序、视频会议等
支持视频会议辅助
文档阅读与总结
连接GPT4、Grok等云端AI
支持多种开发框架
实时桌面应用辅助

机器人军团
NVIDIA 还发布了 NVIDIA Cosmos™ 平台,这是一种专为加速物理 AI 系统(如自动驾驶车辆和机器人)开发而设计的先进工具套件。

Cosmos 包括生成式世界基础模型(WFMs)、高级视频标记器(tokenizers)、安全保障机制和加速视频处理管道。

该平台旨在通过生成逼真、基于物理的合成数据,帮助开发者大幅降低物理 AI 模型开发的成本。
简单来说就是:Cosmos专门用来帮助开发机器人和自动驾驶系统。它通过 AI 模型生成虚拟数据和模拟场景,让开发者可以更快、更便宜地训练和测试他们的 AI 系统,而不用花费大量时间和金钱去采集真实数据。
  • 可实现文本到世界、视频到世界的生成。

  • 提供三种模型:Nano(低延迟边缘部署)、Super(高性能基线模型)、Ultra(高保真模型)。

  • 通过18000万亿次 tokens 的训练,涵盖2000万小时的真实及合成数据。

  • Tokenizers 压缩效率提高 8 倍,处理速度提升 12 倍。



Cosmos主要能力   
  1. 生成虚拟数据
  • 雪天的驾驶环境
  • 仓库中机器人的复杂操作
  • 可以创建超逼真的虚拟场景,比如:
  • 这些数据可用于训练 AI 系统,减少对真实世界数据的依赖。
  • 快速处理视频数据
    • Cosmos 的工具可以快速整理和标记大规模的视频数据,比传统方法快 10 多倍,节省时间和成本。
  • 模拟和测试
    • 模拟不同天气和道路条件(雨天、雾天、拥堵)。
    • 测试机器人在工厂或仓库里的行动能力。
    • 可以在虚拟环境中测试机器人或自动驾驶系统,比如:
  • 帮助开发 AI 模型
    • 提供开源的基础模型,开发者可以根据自己的需求定制,用于机器人或自动驾驶技术。
  • 多种应用场景
    • 用于自动驾驶训练:比如 Uber 和 Waabi 使用它来创建虚拟驾驶测试场景。
    • 用于机器人研发:Agility 和 XPENG 使用它来训练和优化机器人操作。


    现场展示的机器人公司:

    国际

    1. Apptronik:Apollo 机器人
    2. Agility Robotics:Digit 机器人
    3. NEURA Robotics:4NE-1 机器人
    4. Figure:Figure 02 机器人
    5. 1X:NEO 机器人
    6. Mentee:MenteeBot 机器人
    7. Sanctuary AI:Phoenix 机器人



    中国

    1. 宇树科技(Unitree Robotics):H1 机器人

    2. 智元机器人:远征 A2 机器人

    3. 星动纪元:Star1 机器人

    4. 银河通用:G1 机器人

    5. 傅利叶智能(Fourier Intelligence):GR-2 机器人

    6. 小鹏汽车:Iron 机器人



    总结

    本次英伟达发布,将推进人工智能更加应用化,使得模型训练、微调进入消费级领域,同时也将推动AI应用、智能硬件和机器人大爆发!

    看完记得 点赞转发关注 三连

    加入XiaoHu.ai 日报社群 每天获取最新的AI信息


    结束

    小互AI
    XiaoHu.AI 学院(http://xiaohu.ai)学习如何让AI为你服务。加入小互AI学院,获取最新AI资讯、案例、项目、教程。学习如何使用AI...
     最新文章