周末,大事件!

文摘   2025-01-26 17:40   山东  


大家好,我是大师兄。本周末聊一个当下热议的一个公司以及相关产品:DeepSeek------新一代R1模型。


我们先来认识一下DeepSeek这个公司,Deepseek的中文名是“深度求索”,为量化巨头幻方量化的子公司。创始人是80后梁文峰。在2015年1月20日就以超帅的姿态亮相了央视ZI座谈会,是国内最有影响力的幻方量化创始人,其通过在量化投资领域的成功积累,在2023年宣布进军人工智能。


2024年12月26日晚,幻方量化宣布,全新系列模型DeepSeek-V3上线并同步开源,API服务已同步更新,接口配置无需改动。其上一代模型DeepSeek-V2.5于9月6日正式发布,迭代讯速不可谓不快。


据介绍,DeepSeek-V3为自研MoE模型,生成速度相比V2.5模型实现了3倍的提升,但暂不支持多模态输入输出。本次新开源模型仅花费了560万美元进行了2个月的训练,性能匹敌GPT-4o成本将降低10倍以上,可谓是“AI界拼多多”。


现在又刚刚上线了新一代R1模型,并且在世界大模型竞技赛中,与耗费巨资训练出来的Openai并列第一,这震惊了老美科技界!

其实这本来属于前几天的时间,但本周末由于老美创投界大佬的点评,表示R1是其见过最令人惊叹,最令人深刻的突破之一,这是给世界最深刻的礼物,最重要的还是开源,从而导致本周末再次热议了起来。


DeepSeeek--R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。


重要的是openai是耗费巨资推动的大模型训练才得到了当前的版本,并且当前仍处于巨额亏损状态,其目前收费200美元每月,面对可以媲美的震世之作,训练成本仅仅只有600万美元、2000块芯片,并且开源,OpenAI的CEO甚至国内耗费百亿巨资推动的各大模型企业估值都得重新审视!



之所以有这种震世之作也得益于不一样的公司团队。其官网很低调,表示团队是一个极至的理想主义者,也得到了国外大佬们的赞叹,也表示其V2可能是今年最好的论文。而管理模式上使用的是垂直扁平化,谁有了什么设想或者点子不需要层层汇报。招聘人才也不是传统的招人方式,其不仅仅看中谁的资历和高质量的论文。就是因为有这样的团队文化给高度自由创新奠定了坚实的基础。


由此遭到躺枪的是英伟达,这个依靠人工智能芯片登顶的世界最大市值公司宝座后,如今Deepseek的芯片寻求量大幅降低,这还是在老美对人工智能芯片严控下产生的奇迹。周五晚间英伟达已经跳水了3%,周一可能会受到负面影响。新的架构和开源,可能会令全球大模型企业不得不重新审视自己的高耗费效率问题了!


以上分析不构成具体投资建议。股市有风险,投资需谨慎。


给大家推荐个优质的公众号「机会早知道」。在这里,可以更快更及时获取最新题材机会!感兴趣的朋友可以关注一下。


最后,别忘了点击右下角
赠人玫瑰,手留余香,投资路上一起成长!

龙头大师兄
和我一起,探索龙头之路