首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

英伟达最新大模型，开源了！！

科技 2024-10-17 22:22 广东

英伟达不仅要做显卡领域的领先者，还要在大模型领域逐渐建立起自己的优势。

今天，英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct，它击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型。

从命名来看，显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。

从下图中大模型榜单可以看到， Llama-3.1-Nemotron-70B-Instruct 的性能仅次于 OpenAI 最新 o1 大模型了。

图源：https://x.com/itsPaulAi/status/1846565333240607148

目前，Llama-3.1-Nemotron-70B-Instruct 已经可以在线体验了。Starwberry 中有几个 r 这样的题目难不倒它。

图源：https://x.com/mrsiipa/status/1846551610199273817

不过有时也一本正经地胡说八道，比如「2.11 和 2.9 哪个大」。

体验地址：https://huggingface.co/chat/

不过英伟达也强调了，他们主要是提高模型在通用领域的性能，尚未针对数学等专业领域的表现进行调优，或许等待一段时间，模型就可以正确回答 2.11 和 2.9 哪个大了。

此外，英伟达还开源了 Nemotron 的训练数据集 HelpSteer2，包括如下：

构建了 21362 个提示响应，使模型更符合人类偏好，也更有帮助、更符合事实、更连贯，并且可以根据复杂度和详细度进行定制；
构建了 20324 个用于训练的提示响应，1038 个用于验证。

数据集地址：https://huggingface.co/datasets/nvidia/HelpSteer2

除了 Llama-3.1-Nemotron-70B-Instruct 之外，英伟达还开源了另一个 Llama-3.1-Nemotron-70B-Reward 模型。

模型合集地址：https://huggingface.co/collections/nvidia/llama-31-nemotron-70b-670e93cd366feea16abc13d8

模型介绍

Llama-3.1-Nemotron-70B-Instruct 是英伟达定制的大型语言模型，旨在提高 LLM 生成的响应的有用性。

Llama-3.1-Nemotron-70B-Instruct 在 Arena Hard 基准上得分为 85.0，在 AlpacaEval 2 LC 基准上得分为 57.6，在 GPT-4-Turbo MT-Bench 基准上得分为 8.98。

截至 2024 年 10 月 1 日，Llama-3.1-Nemotron-70B-Instruct 在三个自动对齐基准中均排名第一，击败了 GPT-4o 和 Claude 3.5 Sonnet 等强大的前沿模型。

对于这一成绩，有网友表示，在 Arena Hard 基准上拿到 85.0 分，对于一个 70B 的模型来说，确实是件大事。

还有网友讨论说，用相同的提示测试 GPT-4o 和英伟达模型，所有的答案都是英伟达的模型好，并且是好很多的那种。

「加大题目难度，Llama-3.1-Nemotron-70B-Instruct 照样回答的很好。」

在训练细节上，该模型在 Llama-3.1-70B-Instruct 基础上使用了 RLHF 技术（主要是 REINFORCE 算法），并采用了 Llama-3.1-Nemotron-70B-Reward 和 HelpSteer2 偏好提示作为初始训练策略。

此外，Llama-3.1-Nemotron-70B-Reward 是英伟达开发的一个大型语言模型，用于预测 LLM 生成的响应的质量。该模型使用 Llama-3.1-70B-Instruct Base 进行训练，并结合了 Bradley Terry 和 SteerLM 回归奖励模型方法。

Llama-3.1-Nemotron-70B-Reward 在 RewardBench 榜单的 Overall 排名中表现最佳，并在 Chat（聊天）、Safety（安全）和 Reasoning（推理）排名中也有出色表现。

不过，想要部署该模型还需要一些先决条件，至少需要一台带有 4 个 40GB 或 2 个 80GB NVIDIA GPU 的机器，以及 150GB 的可用磁盘空间。想要尝试的小伙伴跟着官方给出的步骤进行部署即可。

参考链接：

https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct

https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Reward

王晶华说科技：追踪企业新动向，人工智能新趋势，技术产业新变革，科技行业新突破。

每天原创不易，希望大家看完文章结尾给我们点一个【赞】+【在看】，你的支持就是我每天坚持创作的动力！

（广告合作请加微信wbh12wbh）

http://mp.weixin.qq.com/s?__biz=MzA5NDAxMjIyOA==&mid=2652551387&idx=3&sn=ba9f34fd6466ae85da0e5a243797126f

王晶华说科技

追踪人工智能新趋势，技术产业新变革，科技行业新突破。

最新文章

英伟达突发！

爆炸！比亚迪突然宣布！

5859亿！华为财报刚刚发布！

今天，ChatGPT正式成为AI搜索，免费使用！

任正非！大消息！

售价6万一部！苹果新机！

100%自主完成任务：机器人ChatGPT时刻来了

重大突破！！

4499元！小米刚刚宣布！

苹果AI终于来了，ChatGPT免费用！

今天，宗馥莉登顶女首富！张一鸣，男首富！

禁售苹果手机！印尼宣布！

Claude团队喜提清华物理学霸姚顺宇！两个Yao Shunyu都投身大模型了

突然公布！奥迪把灵魂卖给了华为！

AI 会自己操控电脑了！

陶哲轩之后，华人再获数学塞勒姆奖，还是位90后

微信！大更新！

阿里同意30亿元和解！关于美国的诉讼

太酷了！深圳造出世界上最酷的机器人！

人民币，大升级！

苹果AI，下周发布！

自动驾驶大地震！文远知行，刚刚上市！市值300多亿！

新华社官媒定调孙院士事件：不要煽风点火

美国科技霸主地位要凉！Nature：中国急速赶超，物理化学论文数已逆袭

Claude 3.5深夜觉醒，学会模仿人类用电脑！

李子柒杀回来了！出手就是王炸！

524亿港币！地平线机器人刚刚上市！打破几项中国纪录

太震撼了！稚晖君刚刚宣布：开源人形机器人全套图纸+代码

网络最新骗局！赶紧看。。

荣耀重大宣布！中国首款AI手机

OpenAI再出「神作」！

今晚突发！华为重大宣布！！！

刚刚，成功发射！

机器人轻松模仿人类，还能泛化到不同任务和智能体！微软新研究

苹果AI落后两年？库克刚刚回应！

终于来了！见证历史！！

小米向全球宣布：中国首款3nm 手机芯片！

数学大佬陶哲轩在巴塞罗那的最新专访！

江苏宣布！重大突破！

LeCun最新万字演讲！全球刷屏！纯语言模型永远到不了人类水平，我们基本已经放弃了

图灵奖得主杨立昆：星舰不算科学成就，而是工程成就；现在 AI 全方面不如猫，智力、记忆和好奇心都差得远

太牛了！中国船舶，刚刚重大宣布！

损失千万美元！网传字节跳动大模型训练遭投毒。。

Windows版ChatGPT，终于来了！

微信大更新！新功能引爆全网！

巨星陨落！图灵奖得主去世，享年70岁！

诺奖得主最新访谈：AI将是划时代的技术！！

突发！阿里，特斯拉紧急通报！！

李彦宏：泡沫不可避免！！

英伟达最新大模型，开源了！！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉