出品 | 虎嗅科技组
作者 | 王欣
编辑 | 苗正卿
头图 | 零一万物提供
在海淀区毗邻北京大学的零一万物办公区中,员工依然忙忙碌碌,仿佛并没有受到外界舆论风波的影响。
身处漩涡中心的李开复,第一时间与虎嗅进行了一对一交流。
是什么契机让李开复重新思考预训练?从什么时候开始暂停对超大模型的追求?做出了什么影响公司命运的关键抉择?
面对虎嗅的灵魂拷问,他依旧保持一贯的温文尔雅,丝毫没有回避外界关心的焦点,并分享了他做出转变的心路历程。
虽然在外界看来零一万物的转变有些突然,但对李开复和零一万物来说这是一次有章法有节奏的“变道”,甚至在半年前就开始长线布局。
以下是虎嗅与李开复沟通实录:
虎嗅:零一万物内部的决策模式是怎样的?比如你是更乐于和大家商量?还是你更相信自己的预判?
李开复:在我创业之初,就集结了一批“愿意相信我,我也很信任他们”的创始团队。谷雪梅、马杰、祁瑞峰、Anita等,这些人从一开始就在我的联创团队里,最初的核心联创团队基本上没有改变,还有约20位勤奋强悍的干将。
我们因为同样信仰AGI,同时也勇于脚踏实地地拥抱应用落地和商业化,所以我们走到一起来。即使在充满压力的状况下,任何同事都可以跟我约一对一的时间,我们固定举办开诚布公无话不说的TGIF全员沟通会,每个重要决策从判断到落地,必定是我们达成共识的结果。
虎嗅:你什么时候开始对预训练有新的思考?有什么关键节点,是你思考这件事的契机吗?
李开复:大模型赛道技术迭代特别快,所以必须做超前预判和布局。在 2024 年 5 月的时候,我们就开始思考预训练的路线问题。在 2024 年 5 月,我们发布了一个千亿参数模型 Yi-Large,当时 Yi-Large 的模型表现很好,在国际权威盲测榜单 LMSYS Chatbot Arena 总榜上取得了当时世界第七、中国第一的成绩。但是从现在往回看, Yi-Large 在模型推理速度和推理成本优化方面,还有相当大的提升空间。
原本我们模型路线图上的下一个版本是更大尺寸的 Yi-X-Large,仍然走稠密模型、需要加倍的卡才能做到的路线。当时我们就面临着一个抉择,是继续沿着 Scaling Law,用更多的 GPU、更多的数据去训练更大参数规模的模型,还是说我们要采更务实的路线,去专注于做更轻量化、但是模型性能依然能保持领先的模型?
我们内部在半年多前就意识到了 Scaling Law 的边际收益递减,对初创公司最直接的就是财务影响,我的财务同事每几周跟我过现金流,看到算力一个月一个月的支出,真不是可持续的方式。赌上巨量资源去训练超大参数规模的模型,超低的性价比对初创公司来说,肯定不是一个务实的选择。
那次的关键技术决策讨论是个节点,经过很多实验后我们决定换一个路线,去年10月零一万物推出的新旗舰模型 Yi-Lightning 是我们一次尝试,Yi-Lightning 采取MoE(混合专家)架构,激活参数仅20多B,但模型表现更出色——模型性能上超过了 2024 年 5 月版本的 GPT-4o,发布时在 LMSYS 上排名世界第六、中国第一(2024 年 10 月 16 日数据)。更重要的是,Yi-Lightning 的模型训练成本仅350万美元,仅是 GPT-4o 的 1/30,我们的推理成本做到行业最低,喊出大模型也能有“白菜价”。
从去年下半年,我们开始暂停对超大参数规模的模型的追求,回头复盘,真是还好没加那多几千卡的成本。
虎嗅:当你意识到这件事情后,你当时做的第一个决定是什么?你如何去推动公司内部接受这个认知,并参与到这个转型之中?
李开复:有了前面提到的这个放弃 X-Large 的转变和验证,公司内部也很快都达成了共识。因为作为亲身经历者,我们每个人都看到了,跟AI 1.0时代不一样,AI 2.0时代大模型技术和产业发展都是被加速的。大模型公司融到了更多资源,但是也因为大模型预训练投入更大的资源。从技术上看,仅仅一年多的时间,引领大模型前进的传统 Scaling Law 边际收益递减明显,商业化上同样如此,我参与过 AI 1.0 时代的投资和孵化,一家公司获得商业化的成功可能有5到8年窗口,相比之下,大模型赛道一切加速,AI 2.0 大模型公司会更快地面临商业模式的灵魂拷问。
在当下的阶段,聚焦“小而美且便宜”的模型,在此之上加速应用落地和商业变现,不论是在技术角度,还是在商业角度,都更实际、更负责,也是更健康、更能走下去的选择。
虎嗅:这个转型中最大的挑战来自什么?
李开复:可能外界观感是零一万物转型调整来得突然,但是我们从去年第二季度开始针对技术路线进行复盘,第三季度开始尝试构建轻量化模型 10 月推出了Yi-Lightning,同时积极在 ToC 和 ToB 领域探索落地,11月份我们首度公布了 ToB 战略,再到 2025 年年初宣布与阿里云成立产业大模型联合实验室,你可以看到,这一切调整都是基于长线战略调整循序渐进、一脉相承的。只是近期一些噪音和歪曲解读突然出现,让我们有章法有节奏的布局对外界显得有些突然。
历史上许多新的技术过了黑科技发明期,面临技术落地和产品化的时候,没能获得商业的成功,这个阶段被称为“创新死亡谷”。零一万物已经证实了我们能做世界级的技术,是时候要关注和聚焦模型能力的落地实现,运转出能良性造血的商业模式。
更确切地说,行业正在集体穿越大模型时代的“创新死亡谷”。
最大的挑战在于有限的资源、有限的时间。行业对 Scaling Law 从追捧到怀疑就不到一年的时间,我们如何在时间表里制定计划、保持敏捷,在有限的资源里最大化我们的执行力。我们必须以快打快,不进则退。
虎嗅:圈内有些公司在做ToB业务同时仍然在做预训练,你如何看待?
李开复:如果一家创业公司的长板足够长,不管你的长板是在模型上还是产品上,都可以一定程度上回答所谓的灵魂拷问。我在这里不点评其他家的做法,我相信大家都能够找到专属于自己的道路。
对于零一万物而言,我们的长板就是能够在保证模型性能处于世界第一梯队的同时,大幅降低训练和推理成本、大幅提升推理速度。大模型公司第一年在前期科研、模型训练方面需要花费巨量的资源,狂奔进入第二年后,初创公司更应该有一个符合商业逻辑、对投资人负责、能确保活下来的商业模式。
虎嗅:在ToB这件事情上,你认为零一万物最本质的竞争力在哪几个维度?这几个维度在你心中它的排列顺序该是什么样的?
李开复:首先,在经过一年多的技术沉淀,零一万物已经具备了世界第一梯队的技术能力,证明了自己能够交付出性能世界领先的模型。我们技术底子够硬。
其次,在寻找落地场景这件事上,我们不像其他 AI 公司能够雇佣数百个销售。但我本人以及联创团队都有着丰富的人脉资源,使得零一万物能够从开始就切入重点领域内的头部公司,快速找到适合凝练出标准化 ToB 解决方案的领域和场景。
第三,零一万物还可以跟创新工场联动。创新工场投资的很多领域的公司,比如 AI 制造、 AI 金融、 AI for Science、具身智能、无人驾驶等等,跟我们都是非常互补的,都可以在行业大模型方面展开合作。
创办零一万物的最初目标是在实现我的 AGI 梦想同时取得商业上的成功,我们要做的是要让顶尖大模型能力走出实验室,去进行产业落地,打造AI-First产业应用,把技术超能力变成“钞能力”,创造实质的商业价值,才能面对最后的灵魂拷问:你到底能不能把技术转换成商业价值?先有收入,再增加收入,然后收窄亏损,最终从单点盈利到多点持续盈利。
虎嗅:你认为2025年在 ToB 业务上,真正考验每家公司的焦点能力是什么?这种情况下我们如何保持自己的竞争优势?
李开复:2025 年是 AI-First 应用爆发的元年,中国有望在应用元年弯道超车,零一万物必须提前卡位。
大模型 ToB 行业的挑战是,客户和技术提供商不是双赢,而是一方压价,另一方因为没有利润只能随便做做。对于大模型公司来说,很大一部分的 ToB 合作客户付费意愿不高,服务场景也很难做成可复制化的产品。这就会变成恶性循环:大模型公司没办法全身心投入,客户也没办法从解决方案中获得业绩增长,最后大家都赚不到钱。
在零一万物看来,有三种 ToB 的方向是值得尝试的。一种是能够为客户创造核心价值的,不仅能省钱,更重要的是能够帮助客户做增长。比如零一万物的如意数字人和万视营销短视频;第二种是在一些特别垂直、又很适合大模型落地的领域,与真正有远见、有决心拥抱大模型的公司一起共创,打造行业大模型。基于目前为人熟知的金融、医疗等领域,零一万物会再向下挖掘更垂直的行业,在这些垂直行业里,行业龙头可能会因为大模型而产生营业额的快速增长。这类企业每个都是金矿,我们已经有了一些尝试。第三就是服务可复制、可快速规模化的领域,服务第一个客户时可能不赚钱,但相似的产品可以服务很多家同类型的客户。
目前,在国内 ToB 方向上,零一万物在游戏、能源、汽车、金融领域都在谈千万以上的单子,而且基本都是软件单。下一个阶段零一万物会继续放大这些领域,也会进入有机会的新领域。如果能结合对方的行业 Know-how、数据和零一万物的技术,比如以共同设立合资公司的形式,一起做细分的行业模型和更好的行业解决方案,就能创造更多价值。我有把握,在 2025 年能有数倍收入增长,从 1 亿做到数亿。
如对本稿件有异议或投诉,请联系tougao@huxiu.com
End
想涨知识 关注虎嗅视频号!