DeepSeek创始人梁文锋因其技术理想主义和对中国AI发展的独特见解,在业内引发了广泛讨论。以下是他的一些不同寻常的观点及其背景分析:
1. “原创式创新是突破差距的关键”
梁文锋多次强调,中国AI与美国的差距并非时间上的“一两年”,而是原创与模仿的本质区别。他认为,中国若想摆脱“追随者”角色,必须从底层技术架构入手,进行原创式创新,而非依赖应用层面的快速商业化。例如,DeepSeek在模型架构上提出的MLA(多头潜在注意力机制)将显存占用降低至传统架构的5%-13%,并通过开源分享技术细节,推动全球AI社区的进步。这种以技术创新为核心的路径,与国内多数大厂“快速商业化优先”的策略形成鲜明对比。
2. “开源是技术生态的基石”
不同于OpenAI等公司的闭源路线,梁文锋坚持开源是构建技术生态的核心。他认为,闭源形成的护城河在颠覆性技术面前是短暂的,真正的价值在于通过开源吸引全球开发者共同参与,形成生态壁垒。例如,DeepSeek的V2、V3和R1模型均选择开源,甚至公开长达53页的技术细节,这种开放态度被图灵奖得主Yann LeCun评价为“代表开源的力量”。梁文锋还表示,开源行为本身是一种“文化吸引力”,能激发技术人员的成就感和社区活力。
3. “技术驱动应优先于商业化”
在多数AI公司急于布局ToC应用时,DeepSeek选择专注于基础模型研究,甚至明确表示“不做ToC应用”。梁文锋认为,当前是技术创新的爆发期而非应用爆发期,过早商业化会分散资源。他提出,未来AI的商业模式应基于专业化分工:DeepSeek专注于底层模型创新,其他公司在其基础上开发应用。这种“克制”在价格战中尤为突出——尽管DeepSeek V2的推理成本仅为GPT-4 Turbo的1/70,但公司仍保持一定利润,而非通过烧钱补贴抢占市场。
4. “人才战略应打破传统范式”
梁文锋的人才管理策略极具颠覆性:
-本土化团队:DeepSeek的核心成员多为中国本土应届毕业生或年轻研究者,而非依赖海外引进的顶尖人才。他认为年轻人“基础能力强、富有创造力且充满热情”。
-扁平化管理:团队采用自下而上的组织结构,研究人员可无限使用算力资源,且决策层直接参与技术讨论,消除层级壁垒。
-文化导向:他提倡“创新需要尽可能少的干预”,认为技术突破更多源于自发性探索而非刻意规划。
5. “闭源护城河是伪命题”
针对行业普遍担忧的技术保密问题,梁文锋直言闭源无法形成长期优势。他以英伟达为例指出,技术秘密的护城河本质是“时间差”,而真正的竞争力来自持续创新能力和组织文化的积累。这种观点促使DeepSeek选择开源,并将价值沉淀在团队成长和创新能力上。
6. “硬核创新需要社会观念转型”
梁文锋结合自身成长经历指出,中国AI创新的障碍并非资本或资源,而是社会对“赚快钱”的惯性依赖。他提到,早年广东家长普遍认为“读书无用”,但随着经济结构转型,社会逐渐认识到硬核技术的重要性。他预测,未来中国将涌现更多原创式创新,因为“当创新者功成名就时,群体观念必然改变”。
DeepSeek创始人梁文锋一些不同寻常的观点:
关于技术创新与投入
• 投入与创新的关系:梁文锋认为更多的投入并不一定产生更多的创新,否则大厂就可以把所有创新包揽。这与一些人认为大厂凭借资金和资源优势能够主导创新的观点不同,他强调创新更多依赖于对技术前沿的敏锐洞察和独特的组织管理。
• 技术创新的重要性:他指出中国AI不可能永远处在跟随的位置,真正的创新迫切需要一种自信,以及对高密度人才组织的有效管理。在当前很多公司满足于应用创新的环境下,他坚持将技术创新作为第一优先级。
• “弯路”的价值:在大模型技术被认为趋同、跟随是捷径的环境中,DeepSeek却看重“弯路”中积累的价值,认为中国的大模型创业者可以加入到全球技术创新的洪流中。
关于公司发展与商业模式
• 不做应用的抉择:DeepSeek是唯一一家放弃“既要又要”路线,至今专注在研究和技术,未做toC应用的公司。梁文锋认为当前阶段是技术创新的爆发期,而不是应用的爆发期,长远来看,他们希望形成一种生态,让业界直接使用他们的技术和产出。
• 开源策略:在行业开始趋向于闭源模型时,DeepSeek仍坚定选择开源。梁文锋认为在颠覆性的技术面前,闭源形成的护城河是短暂的,他们把价值沉淀在团队上,形成可以创新的组织和文化才是真正的护城河。
• 融资与资金态度:DeepSeek短期内没有融资计划,梁文锋表示他们面临的问题从来不是钱,而是高端芯片被禁运。这种不依赖外部资本,专注于自身技术发展的模式与很多依赖融资的AI公司不同。
关于人才与组织管理
• 人才选拔标准:DeepSeek选人的标准是热爱和好奇心,而不是传统的评价指标。他们擅长从细节招人,能让一些非传统评价指标里优秀的人脱颖而出,这种对人才的独特理解和选拔方式有助于挖掘到真正适合公司发展的人才。
• 组织结构与管理方式:公司保持着一个完全自下而上的组织结构,为研究人员提供无限的计算资源,不存在层级和跨部门,每个人可以灵活调用训练集群的卡和所有人。这种松散的管理方式与传统公司层级分明、资源调配需要层层审批的模式有很大不同,更能激发研究人员的创造力。
关于行业趋势与未来展望
• 对生成式AI与AGI的看法:梁文锋认为他们要做的不是生成式AI,而是通用人工智能AGI,生成式AI只是AGI的必经之路,AGI会在他们有生之年实现。这体现了他对行业发展的长远眼光和更高目标的追求。
• 对中国AI发展的信心:他坚信中国AI产业将更加依赖硬核技术创新,原创式创新将越来越多。这种信心在当前中国AI整体处于追赶阶段的背景下显得尤为突出,也与一些人对中美AI差距的担忧形成鲜明对比。
总结:技术理想主义者的突围
梁文锋的观点挑战了行业对商业化速度、人才来源和技术路线的传统认知。其核心逻辑是:通过原创式创新和开源生态,中国AI可以突破“跟随者”定位,并在全球技术竞争中占据主动。这种理想主义与幻方量化的技术积累(如“萤火”超算集群)相结合,为DeepSeek的快速崛起提供了底层支撑。尽管外界对其商业化路径仍有质疑,但其在硅谷引发的“神秘东方力量”效应,已证明这种模式的生命力。
来源:债权人、网络、钱经
欢迎关注“钱经”: