英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发

科技 2025-01-18 13:33 辽宁

作者 | Sergio De Simone

译者 | 刘雅梦

策划 | 丁晓昀

英伟达（Nvidia）推出了 Llama Nemotron 大语言模型（LLM）和 Cosmos Nemotron 视觉语言模型（VLM），特别强调由 AI 智能体代理驱动的工作流程，例如客户支持、欺诈检测、产品供应链优化等。Nemotron 系列中的模型有 Nano、Super 和 Ultra 等尺寸，以更好地满足不同系统的要求。

英伟达表示，人工智能智能体代理是生成式人工智能进化的一个新前沿，旨在创建能够自主执行复杂任务的系统。这需要将 LLM 所展现的语言技能与感知和与环境互动的能力相结合。

为了提高效率，许多人工智能智能体代理既需要语言技能，也需要感知世界并做出适当行动的能力。

这就解释了为什么 Nemotron 模型系列包括了源自 Meta 的 LLaMA 模型的衍生模型，以及能够分析和响应在用户环境中所捕获的图像和视频的新 Cosmos Nemotron VLM。

英伟达表示，具备视觉功能的智能体代理可以实时分析来自多种环境中的工业摄像头的视频，从而帮助检测事故、减少缺陷，或指导人类采取某些行动。按照该公司的说法，目前只有不到 1% 的工业摄像头的视频是由人类实时观看的。

根据英伟达的说法，他们训练 Llama Nemotron 模型，使其能够高效地执行许多常见的代理任务，因此你只需使用这一个模型即可，而无需用多个专用模型。

对模型进行修剪以减少延迟并提高计算效率，然后使用具有蒸馏和对齐方法的高质量数据集进行再训练，以提高跨任务的准确性。这样可以使模型更小，精度和吞吐量更高。

Nemotron 模型针对不同的计算需求进行了优化，包括面向 PC 应用程序开发人员的 Nano、在单个 GPU 上提供高性能的 Super，以及专为数据中心规模应用程序设计的 Ultra。

英伟达 Nemotron 生态系统还包括 Nvidia NeMo，用于使用专有数据的定制模型，以及 NeMo Aligner，用于更好地对齐模型以遵循指令并生成人类偏好的响应。此外，英伟达还提供了 Nvidia AI Blueprints，作为一种工具，通过使用 NIM 微服务作为构建块来为 Nemotron 模型提供服务，从而快速创建 AI 智能体代理。

与此相关的是，英伟达还宣布了其 Cosmos world foundation 模型，该模型专门用于为机器人和自动驾驶汽车生成物理感知视频。

作者介绍

Sergio De Simone 作为一名软件工程师，已拥有超过 25 年的经验。他在不同的项目和公司工作过，包括西门子、惠普和小型初创公司等不同的工作环境。在过去的十多年里，他一直专注于移动平台和相关技术的开发。他目前就职于 BigML, Inc.，负责 iOS 和 macOS 的开发。

原文链接：

https://www.infoq.com/news/2025/01/nvidia-nemotron-agents/

声明：本文为 InfoQ 翻译，未经许可禁止转载。

今日好文推荐

中国软件重塑的关键一年：这 11 大领域迎来了自己的“ChatGPT时刻”

开源首秀就放大招！MiniMax 重磅更新两款大模型，业内首次大规模实现线性注意力机制

TikTok 难民给小红书带来了一波“泼天富贵”，美国网友震惊：技术团队居然能这么拼！

一次App更新失败，CEO不得不辞职谢罪：技术重构导致用户纷纷将数千元高科技产品丢进垃圾堆

InfoQ

为一线互联网公司核心技术人员提供优质内容。科技圈的观察者，前沿技术的传播者。

DeepSeek霸榜一周：奥特曼终于承认在开源问题上处于“历史错误的一边”；迅雷斥资5亿收购“直男社区”虎扑 | Q资讯

微软、AWS后，英伟达也已接入DeepSeek，扎克伯格：是的，我们也将“偷师”DeepSeek

一场由DeepSeek引发的技术裂变，正在重写AI时代的权力分配方程式

一场关于 DeepSeek 的高质量闭门会：比技术更重要的是愿景

DeepSeek震动硅谷AI圈，GPT-5还秘而“不发”？7千亿利润奥特曼都看不上了

AI大模型、机器人上春晚！直点播收视28.17亿次，用云量达历年之最

DeepSeek“人均百万”传言引爆求职热潮，非算法岗应届生年薪百万，HR简历收到手软

OpenAI 想了快 10 年的超级智能体终于来了！有惊喜，但比智谱晚还“翻车”系数高？

英伟达 RTX 5090、5080 和 5070 Ti 最新基测：不支持 DLSS 的游戏将拥有更多 AI 能力

Java近期新闻：JDK 24进入Rampdown Phase Two、Spring、JobRunr、Commonhaus基金会

17 岁移民少年靠 AI 逆袭！一夜之间到账数十亿，这个小众赛道赚麻了

大厂“年终奖”开卷！你发了多少？用友预计年亏损超17亿！员工数减少三千多人；“支付宝碰一下”启动“你敢碰我敢赔”保障 | Q资讯

游戏开发者已经厌倦了老板的 AI 计划

Java 24 功能已冻结，进入 Rampdown 第二阶段

PHP 程序员被特朗普特赦：本应终老监狱，因“技术细节”落网

用 5 万换价值 73 亿的股份？因离职让寒武纪市值蒸发 60 亿的 CTO，与老东家“开撕”了！

使用 DuckDB 的进程中分析数据管理

“自由画布”开启公测，百度文库 AI 功能月活量突破 9000 万

Baichuan-M1-preview 发布！集齐语言、视觉、搜索三大推理能力，解锁医疗循证模式

硅谷三巨头组AI联盟，“大腿”特朗普壕砸5000亿美元！网友：有孙正义铁定要黄

海量日志数据检索ELK场景下Kafka磁盘故障技术解密

微软的 Hyperlight WebAssembly 虚拟机现已开源

Apache Hudi 1.0 正式发

做 CTO 还不如自己干？他靠独立开发赢得平静自由的生活，收入比当 CTO 还高！

开源方案之外的选择：阿里内部为设计打造的 AIGC 生产力平台 MuseAI

Express.js 时隔十年发布 5.0.0 版本，聚焦稳定性与安全性

Rust 1.84 已发布，包括可能会破坏工具链的 WASI 目标更名

k1.5多模态思考模型登场，再一次震惊海外AI圈，网友：压力给到OpenAI

AI 杀死了程序员培训班：花 1.3 万美元学编程，却连面试机会都没有？

北航 &ZGCLAB 提出首个检索增强生成基准测试工具库 XRAG

软件开发人员为何需要打造个人品牌

GitHub Git 因配置更新错误而停机

卖身、豪赌Killer App的AI 厂商：被“吊”麻了，明年咋活？

大模型推理新突破：分布式推理技术探索与实践

中国 AI 人才缺口将达到 400 万，企业如何掌握 AI 人才资源？｜附免费福利

撤销拜登所做的一切！特朗普明天上任“大洗牌”：绿卡“不卡”硅谷人才、TikTok“开香槟”还太早？

Java 近期新闻：WildFly 35、Jakarta EE 11更新、Java Operator SDK 5.0-RC1

RAG 的未来，走向繁荣、重塑还是消亡？

半空：LLM 辅助的 Go2Rust 项目迁移

加强对“完成的定义”可改善最小可行架构

微软研究院开源 AIOpsLab：一个 AI 驱动的云运维框架

这群 00 后“杀疯”了！没靠资本、大学刚毕业狂赚 7 千万，TikTok 助攻 AI 爆款应用出世

支付宝深夜回应重大bug事故；英伟达造富神话：近八成员工已是百万富翁；TikTok“难民”闯荡小红书 | Q资讯

加速 AI 训推：Lepton AI 如何构建多租户、低延迟云存储平台？

敏捷联盟加入项目管理协会

刚刚！谷歌宣布重大调整：没 JavaScript 将无法启动搜索！网友怒斥“技术霸权”！

大语言模型应用开发框架 Eino 正式开源！

拜登 AI 芯片新规把自家公司也坑进去了！英伟达怒斥“乱搞”，OpenAI 以超越中国为由索要机密数据

英伟达 Nemotron 模型旨在加速 AI 智能体代理的开发

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉