国君计算机|国产大模型性能领先,场景应用加速落地

财富   2025-01-02 06:17   上海  

投资建议:DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破。DeepSeek-V3在多项评测中超越多款顶尖模型,且成本极具竞争力。因此AI大模型在各行业落地的技术路径有望逐步明确,MoE架构的低成本、高性能的大模型在垂类领域中的运用潜力巨大。

DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力,具备高投资价值。DeepSeek正式发布了其全新系列模型DeepSeek-V3,并同步开源。该模型为自主研发的MoE架构,拥有6710亿参数和37亿激活参数,在14.8万亿token上进行了预训练。DeepSeek-V3在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,其性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知识类任务、长文本处理、代码编写和数学竞赛等方面表现出色。

DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值。通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从每秒20次提升至60次,实现了3倍的性能提升,用户体验更加流畅。DeepSeek调整了API服务的价格,新的定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。高性价比有望为DeepSeek带来了更大市场份额和收入增长。

DeepSeek-V3的开源权重和本地部署能力增强其社区支持和应用扩展性,推动了技术生态发展。DeepSeek-V3采用FP8训练,并开源原生FP8权重,得到开源社区的广泛支持。DeepSeek提供从FP8到BF16的转换脚本,方便社区进行适配和拓展应用场景。模型权重可通过Hugging Face平台下载,进一步促进了本地部署和多样化应用。这种开放的生态系统为其在AGI普惠化方面奠定了坚实基础。

风险提示:较低定价压缩盈利空间,技术竞争加剧的风险。

   文章来源 

本文摘自:2024年12月31日发布的《国产大模型性能领先,场景应用加速落地

李博伦,资格证书编号:S0880520020004

伍   巍,资格证书编号:S0880123070157


更多国君研究和服务

亦可联系对口销售获取


重要提醒


本订阅号所载内容仅面向国泰君安证券研究服务签约客户。因本资料暂时无法设置访问限制,根据《证券期货投资者适当性管理办法》的要求,若您并非国泰君安证券研究服务签约客户,为保证服务质量、控制投资风险,还请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。我们对由此给您造成的不便表示诚挚歉意,非常感谢您的理解与配合!如有任何疑问,敬请按照文末联系方式与我们联系。



法律声明


本公众订阅号(微信号: GTJARESEARCH )为国泰君安证券股份有限公司(以下简称“国泰君安证券”) 研究所依法设立、独立运营的唯一官方订阅号。其他机构或个人在微信平台上以国泰君安研究所名义注册的,或含有“国泰君安研究",或含有与国泰君安证券研究所品牌名称相关信息的其他订阅号均不是国泰君安证券研究所官方订阅号。

本订阅号不是国泰君安证券研究报告发布平台,本订阅号所载内容均来自于国泰君安证券研究所已正式发布的研究报告,如需了解详细的证券研究信息,请具体参见国泰君安证券研究所发布的完整报告。

在任何情况下,本订阅号的内容不构成对任何人的投资建议,国泰君安证券也不对任何人因使用本订阅号所载任何内容所引致的任何损失负任何责任。

本订阅号所载内容版权仅为国泰君安证券所有,国泰君安证券对本订阅号保留一切法律权利。订阅人对本订阅号发布的所有内容(包括文字、影像等)进行复制、转载的,需注明出处为“国泰君安研究”, 且不得对本订阅号所载内容进行任何有悖原意的引用、删节和修改。



国泰君安证券研究
国泰君安研究所官方账号
 最新文章