2023年OpenAI的ChatGPT问世,一颗惊雷引爆了AI的史诗级行情,随后百度的文心一言、科大的星火,月之暗面的Kimi,之后24年诞生了智谱AI、Sora、豆包,每一款突破性的AI大模型在A股都掀起了一波炒作了热潮。
这个周末,一款名叫DeepSeek-R1的国产大模型挤进了国外大模型排名Arena全类别的第三名,在风格控制类模型分类中与OpenAI o1并列第一,DeepSeek移动端在苹果 App Store应用商店排行第八,下载热度仅次于ChatGPT,一系列消息刷屏了美国各大主流媒体和社交网站。
AMD 表示, DeepSeek V3 是目前最强的开源 LLM,甚至超过了 GPT-4o。目前,AMD 宣布已把新的 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上。
DeepSeek-R1到底是什么?这一款一夜火爆全球的大模型又将迎来哪些机会?
DeepSeek-R1是幻方量化旗下 AI 公司深度求索(DeepSeek)2025年1月发布的一款深度求索推理大模型。它在后训练阶段大规模使用了强化学习技术,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
更重要的是,DeepSeek凭借模型架构创新、算法优化、数据优化、基础设施优化、强化学习技术运用降低了大量成本。据了解,DeepSeek预训练费用只有区区不到 550 万美元,相比之前传言的GPT-4大约1亿美元的训练费用,成本可以说是忽略不计了。因此DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/4 元(缓存未命中),每百万输出 tokens 16 元,远低于可比大模型 API 服务。
同时,DeepSeek还是开源的,登录 DeepSeek 官网或官方 App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。新模型发布后,近期访问量激增,今天更是爆出服务器繁忙,一度闪崩了。
经济日报也发文认可DeepSeek的成功,也证明大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。
周五晚英伟达股价大跌3.12%,报142.62美元/股,创下公司在年初 CES 展产品不及预期表现后的最大跌幅,这也不等不让人把DeepSeek 的出现与近期英伟达的回调联系在一起。
DeepSeek-V3极低的训练成本预示着AI大模型对算力投入需求将大幅下降,这可能会降低对高端GPU的依赖,削弱市场对英伟达AI芯片需求的预期。
机会方面,DeepSeek火爆出圈,相关股权关联方、数据提供商、算力基础设施供应商、合作方都有望引来一波炒作,短期可以积极关注
END
风险提示:上述行情观点分析内容、策略分析(包括但不限于图片、文章、音视频等) 及操作仅供您参考和学习使用,不构成投资建议,不构成对任何金融产品的购买、抛售或持有的建议,不承诺您获得投资收益,本平台不作任何担保。您应自主做出投资决策,自行承担投资风险和损失,投资有风险,入市须谨慎!中广云智投--投资顾问 胡 佳 登记编号:A0260622070004
由于微信公众号改版导致您可能会错过我们的最新文章,如果您觉得我们的文章让您有所收获,可以把【中广研究】加入星标哦!
如果您觉得我们的文章有价值欢迎转发和点在看!
点击在看 持续关注↓↓↓