最近一段时间,DeepSeek无疑是科技圈焦点中的焦点。由幻方量化旗下人工智能初创公司深度求索公司推出的AI大模型,一度登顶多个应用商店全球下载榜单之首。DeepSeek的火爆出圈,也点燃了资本市场的热情,春节节后开盘以来,DeepSeek概念、云计算等指数一路高歌猛进,涨幅均超10%,计算机、传媒板块也在中信一级行业中涨幅居前(数据来源:Wind,截至2025.2.7)。
DeepSeek 究竟凭什么能引发如此巨大的关注?AI行情又是否会在 DeepSeek的强力催化下,续写辉煌,再攀新高呢?
DeepSeek的突破主要体现在低成本和推理能力两方面。V3模型在训练成本和计算效率上取得了显著进展,而R1模型则开创了训练推理模型的新方法,通过FP8、MoE、MLA、PTX等工程优化,不仅将算力资源利用率最大化,显著降低成本(例如其训练成本仅为OpenAI同类模型的1/30),且在数学、代码和自然语言推理任务上表现出色,性能上比肩OpenAI o1。
在DeepSeek-R1模型之前,业界大模型普遍使用RLHF(Reinforcement Learning from Human Feedback,基于人类反馈的强化学习),这一模式使用大量由人类撰写的高质量问答以了解“什么才是好的答案”,就像是有一个老师一直在旁边指导解题。这种方法虽然有效,但也存在瓶颈。R1模型突破性地放弃了RLHF中的HF(人类反馈)部分,只留下纯粹的RL(强化学习),相当于不再依赖老师的指导,而是自己动手动脑,通过不断尝试和犯错来学习。
具体来说,R1模型的强化学习模式给自己设定了两个“奖励函数”:
结果正确函数:每当找到一个正确答案时,就会给自己一个奖励。这个答案是通过外部工具验证的,确保是真正正确的。
思考过程函数:即使答案不一定完全正确,只要推理过程逻辑清晰、步骤合理,也会给自己一个奖励。这就像是解题时,虽然最后答案不对,但思路很棒,值得鼓励。
通过这种方式,R1模型不断尝试不同的解题方法,然后根据这两个奖励规则来评估自己的表现,最终学会了哪些方法更有效,哪些推理步骤更合理,最终变得越来越聪明,提升了推理能力。最重要的是,R1模型在这个过程中不需要大量的标注数据,而是通过自我学习和优化来提升能力。同时开源实现模型平权,缩短了开源模型和闭源模型的技术差距,也缩短了中国和美国人工智能之间的技术差距。
对于这一轮AI行情及未来潜在机会,摩根士丹利基金权益投资部总监、大摩数字经济混合基金经理雷志勇表示,DeepSeek的火爆意味着全球人工智能领域未来的发展可能更具有多元性,同时大模型降本也预计会加速人工智能应用端商业化闭环的形成。DeepSeek有望加速人工智能应用落地,带动后训练端、推理端算力需求的爆发增长。算力板块后续结构上推理端需求占比预计会进一步提升,对于推理算力芯片、端侧算力形成利好。
针对美股科技股此前经历的调整,雷志勇认为,美股科技股下跌主要由于市场对训练端算力投入存在担忧,DeepSeek大幅缩短和闭源模型的差距后,市场担忧对训练端算力投入的必要性。整体来看,DeepSeek模型自身迭代仍然遵循Scaling Law,其V1到V3模型的参数量和训练token都在放大,但文本类的pre-training scaling law基本结束,后续预计将向推理模型和多模态发展,且推理模型迭代加速。因此,在对人工智能技术趋势保持乐观的背景下,预计美股科技股后市仍然具备投资机会。
至于DeepSeek概念行情能否持续,雷志勇认为取决于后续国内人工智能应用比如ToB端的软件应用或者SaaS公司形成商业化的进程,以及端侧AI+硬件能否逐步走向商业闭环。A股的推理侧、端侧算力芯片公司和软件应用头部公司,以及港股中积极布局人工智能的相关龙头企业,或有望受益于DeepSeek带来的国内人工智能浪潮。
查看往期精彩内容↓↓↓