英伟达推出Nemotron-70B:强大开源语言模型,基准测试中全面领先!

2024-10-18 16:32   上海  


前沿科技速递🚀


近日,英伟达震撼推出了一款划时代的开源模型——Nemotron-70B。在多项基准测试中,这一基于Llama 3.1的模型表现卓越,分别在Arena Hard、AlpacaEval 2 LC和MT Bench中夺得第一名,标志着开源模型性能的重大突破。


来源:传神社区
01 模型简介

Nemotron-70B是英伟达最新推出的一款开源语言模型,基于Llama 3.1架构,旨在生成高质量的自然语言响应。该模型特别采用了人类反馈强化学习(RLHF)技术进行微调,使其更能符合人类用户的需求和期望。在训练过程中,Nemotron利用了21,362个经过精心设计的prompt-response数据对,确保生成的内容不仅准确,而且能够流畅地与人类思维相匹配。此外,Nemotron在处理复杂问题时展现出惊人的推理能力,能够在没有特别提示的情况下,轻松回答如「草莓有几个r」这类经典难题。

Nemotron-70B不仅提升了自然语言生成的质量,还在推动开源模型的发展方面树立了新的标杆,预示着AI技术在未来将迎来更广泛的应用和发展。

02 技术亮点
Nemotron 的优异表现源于其多项核心技术创新,主要包括:
  • RLHF 微调
    Nemotron 使用人类反馈强化学习(RLHF)进行微调,具体采用了REINFORCE算法。该算法通过模拟人类的反馈,优化模型生成的内容,使其更贴近用户的期望。RLHF 使模型不仅能理解语言的表面含义,还能把握语境、语气和人类的隐含意图,从而生成更加自然和连贯的回应。这种训练方式增强了模型的灵活性,使其能够在不同场景下适应用户需求。
  • 高质量训练数据
    Nemotron通过21,362个精心设计的prompt-response数据对进行训练。这些数据集包括多种复杂的对话场景,确保模型在生成内容时的准确性和合理性。具体来说,数据集由20,324个用于训练,1,038个用于验证,这样的划分可以有效提高模型的泛化能力。此外,数据的多样性和代表性确保了模型在处理各种主题时的表现均衡,避免了偏见和误导。
  • HelpSteer2 偏好提示:使用HelpSteer2-Preference提示,Nemotron能够引导模型生成更符合人类偏好的回复。这种偏好提示通过反馈用户的需求,帮助模型在生成内容时更加注重可用性和相关性。HelpSteer2的引入不仅提升了模型的实用性,还增强了用户的互动体验,使其更易于集成到实际应用中。
  • 强大的模型架构
    Nemotron基于Transformer架构,利用多头自注意力机制和深层神经网络,显著提高了模型的并行处理能力和信息捕捉能力。这种架构使得模型能够在处理长文本时保持上下文的一致性,生成的内容更加连贯和有逻辑性。
  • 大规模推理能力
    Nemotron支持最大128k tokens的输入和最大4k tokens的输出,展现了其强大的文本处理能力。这种设计不仅适用于短文本生成,还能处理复杂的对话和长篇文本,适合各种应用场景,如客服系统、内容创作等。
  • 高效的部署支持
    Nemotron的设计充分考虑了高效的部署需求,兼容NVIDIA Ampere、Hopper和Turing微架构,确保在高性能GPU上能实现快速推理。这使得开发者能够在不同硬件环境中灵活部署,并充分利用计算资源,提升应用的响应速度。

03 卓越性能

  • 基准测试成绩
    截至2024年10月1日,Nemotron在多个重要基准测试中均名列第一。在Arena Hard上得分85.0,显示了其对复杂对话和推理问题的强大处理能力;在AlpacaEval 2 LC中得分57.6,表明其在生成符合人类期望的内容方面表现出色;而在MT Bench (GPT-4-Turbo)中,得分8.98,更加巩固了其在开源模型中的领先地位
  • 精准回答能力
    Nemotron能够在没有特殊提示的情况下,准确回答复杂问题,例如「草莓有几个r」,这是许多先进模型的难点。这种能力表明其在自然语言理解和生成方面的深厚底蕴,使其在处理各种问题时更加自信和准确。
  • 强大的推理能力
    通过RLHF微调和高质量训练数据,Nemotron在面对复杂推理任务时展现出显著优势。它能灵活处理多种情境和上下文,适应用户的特定需求。这种灵活性使得Nemotron在客服、教育等应用场景中表现尤为突出。
    在即便是在没有专门提示、额外推理token的情况下,Nemotron-70B也能答对「草莓有几个r」经典难题。

  • 高效的计算性能
    在计算资源方面,Nemotron优化了模型的运行效率,确保在较低的延迟下提供高质量输出。通过在高性能NVIDIA GPU上运行,Nemotron能够快速响应用户请求,提升整体应用体验。

04 模型下载

传神社区:
https://opencsg.com/models/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF
huggingface:
https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct-HF





欢迎加入传神社区



•贡献代码,与我们一同共建更好的OpenCSG


•Github主页

欢迎🌟:https://github.com/OpenCSGs


•Huggingface主页

欢迎下载:https://huggingface.co/opencsg


•加入我们的用户交流群,分享经验



扫描上方二维码添加传神小助手






“      关于OpenCSG

开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。


关注OpenCSG

加入传神社区



传神社区
该账号是开放传神(OpenCSG)分享大模型的技术、见解、传神开放社区等方面的内容!
 最新文章