2023年夏季,Meta创始人兼首席执行官马克·扎克伯格(Mark Zuckerberg)面临着一个关键抉择:是否将生成式AI模型“Llama 2”开源,让它与OpenAI的GPT-4一较高下。
在那几个月前,初代Llama面世,它最初只是为研究人员准备的,但在被泄露到网上后,立刻受到了开发者的欢迎,因其免费且开源,与OpenAI、谷歌等公司的收费模型不同。开源意味着,研究人员、开发者和其他用户可以访问底层代码及其“权重”(决定模型如何处理信息),从而使用、微调或改进它。
Meta首席AI科学家杨立昆(Yann LeCun)和AI研究副总裁兼Meta FAIR团队负责人乔勒·皮诺(Joelle Pineau)等高管,都希望Llama 2能更广泛地开源。他们认为,这将使Llama 2以更低的成本、更快的速度变得更强大,帮助Meta在AI竞赛中追赶其他对手。在这场竞赛中,Meta明显落后,尽管它正试图从元宇宙转型的困境中恢复过来。
然而,开源也存在许多挑战。一旦用户习惯了免费产品,公司该如何实现盈利?此外,正如高管们在辩论中指出的,法律风险也不容忽视:如果有人恶意利用这个模型进行黑客攻击,后果不堪设想。更令Meta担忧的是,之前两个开源AI产品都引发了广泛批评,从科学家到参议员,无一不对Meta提出严厉指责。
此时,扎克伯格成为了打破僵局的关键人物。他一直倡导开源技术(Facebook本身便是基于开源软件构建的),但在做出决定前,他广泛听取了各方意见。Meta生成式AI主管艾哈迈德·达勒(Ahmad Al-Dahle)回忆道,扎克伯格与所有持支持、反对者以及持中立立场的人都进行了深入交流。最终,扎克伯格亲自拍板,决定开源Llama 2,供研究和商业使用。
扎克伯格在个人Facebook页面上发文,进一步阐释了他的决定。他坚信开源能够吸引更多开发者使用特定技术,从而推动创新。他写道:“我相信,如果生态系统更加开放,将会带来更多的进步。”
这一事件或许只是AI快速发展历程中的一个小插曲,但对Meta和扎克伯格而言,Llama 2的发布却是一个至关重要的转折点,它标志着Meta将被重塑。到2024年4月Llama 3横空出世,无论在速度还是准确性方面,已基本追上甚至超越了那些闭源的竞争对手。在几个基准测试中,Llama 3模型甚至与OpenAI和Anthropic最好的模型相当,甚至表现得更好。Llama的一大优势在于,Meta利用了数十亿Facebook和Instagram用户公开分享的数据来训练其AI模型。
在开源AI模型(通常更透明、更灵活、更具成本效益,但可能更容易被滥用)与闭源模型(控制更严格,但缺乏透明度,开发成本更高)之间的哲学争议中,Llama的故事或许将成为关键篇章。更重要的是,Llama成为了Meta全力投入生成式AI战略的核心支点。
如今,扎克伯格在硅谷开发者眼中已成为了“科技民主化”的捍卫者,而两年前,他和Meta还因全力投入元宇宙而备受质疑和嘲笑,更因助长政治两极分化、极端主义以及损害青少年心理健康而饱受诋毁。
Llama模型崛起,
有望树立新的行业标准
尽管ChatGPT在大众心中仍是主流AI工具的代表,但实际上,Llama模型已悄然融入Meta的众多产品中,每天服务着数十亿消费者。从Facebook、Instagram、WhatsApp到Messenger的AI助手,再到用户可自定义的AI聊天机器人,以及广告客户的文本生成工具,Llama变得无处不在。它甚至为Meta与雷朋合作开发的智能眼镜以及Quest头显中的智能助手提供技术支持,让用户能与周围环境进行互动。传闻中,Meta还在研发自己的AI搜索引擎。在开源AI社区Hugging Face等网站上,Llama模型的下载量已突破6亿次大关。
Llama也是Meta聊天机器人Meta AI的“大脑”,该机器人可在Meta四大社交媒体上使用——Facebook、Instagram、WhatsApp和Messenger。Meta报告称,在第三季度末,Meta AI已经拥有超过5亿的月活跃用户。扎克伯格预计,到今年年底,Meta AI将成为使用最多的人工智能聊天机器人,超过OpenAI的ChatGPT、Alphabet的Gemini和其他竞争对手。Meta AI已经悄然确立了自己在生成式AI领域的领导地位。
然而,Meta的这一转型却让不少观察者感到费解。该公司不惜斥资数十亿美元打造Llama,并预计2024年资本支出将高达400亿美元,未来还可能继续大幅增长。同时,Meta还将Llama免费提供给包括高盛、AT&T和埃森哲在内的数千家企业。这让一些投资者不禁疑惑,Meta何时才能实现盈利,以证明这笔巨额支出是值得的。
加州大学伯克利分校哈斯商学院的副教授阿布舍克·那格拉杰(Abhishek Nagaraj)也表示,从经济角度来看,开源Llama对Meta的益处仍是个“大谜团”。
但不可否认的是,Llama的成功让扎克伯格摆脱了外界对其超现实雄心的质疑,也帮助其公司度过了2022年底和2023年初的“效率年”困境。更重要的是,Llama的崛起为扎克伯格提供了一个解决长期痛点的机会:即Meta的服务和产品常受苹果和谷歌规则的限制,这两个竞争对手的应用商店是Meta在移动设备时代的主要分发渠道。扎克伯格曾在博客文章中写道:“我们必须确保自己始终能获得最好的技术,并避免被竞争对手的封闭生态系统所束缚。”
如今借助Llama,Meta和扎克伯格有机会树立新的行业标准。他在财报电话会议上表示:“Llama 3.1将是行业的转折点,开源AI将像Linux一样成为行业标准。”他提到了打破微软Windows等专有操作系统主导地位的开源项目,暗示Llama有望引领这一变革。
或许正是这种潜在的可能性帮助扎克伯格重新恢复了信心。在他与人共同创立Facebook已逾20年后,40岁的他仿佛正经历着一场所谓的“扎克复兴”——个人形象与职业生涯均焕发出新的光彩。他已从往日的短发转变为浓密的卷发,单调的卫衣也被金链子和宽大的黑色T恤所取代,曾经棱角分明的面容如今常挂着轻松的微笑。甚至,在11月份,他还抽空与T-Pain合作翻拍了热门歌曲《Get Low》,以此作为送给妻子普莉希拉·陈Priscilla Chan)的周年纪念惊喜。
皮诺(左)和达勒共同领导着Meta的生成式AI研发工作
不按套路出牌,
通过开源抢占AI优势赛道
值得注意的是,Llama 2并未实现完全开放。Meta并未透露用于训练模型的数据集,其中包括Facebook和Instagram上的所有数据,这些数据被广泛视为Meta的关键竞争优势。同时,Meta还限制月活跃用户超过7亿的公司使用其服务,主要是为了防止大型科技竞争对手的介入。不过,源代码和模型权重仍然可以下载,Meta也鼓励用户向协作社区贡献改进意见、漏洞修复以及优化结果。
甚至在Llama 2发布之前,扎克伯格就已经为其爆火奠定了基础,并将其视为Meta的下一件大事。在首个Llama模型于2023年2月发布后,扎克伯格迅速从整个公司抽调人员组建了专门的团队,专注于加速生成式AI的研发进程,以便将其应用于Meta应用的各项功能和工具中。他选择了前苹果高管达勒来领导这个全新的团队。达勒于2020年加入Meta,此前从事元宇宙产品的开发工作。
在2023年6月的一次内部全体会议上,扎克伯格分享了他对Meta AI未来的展望。他表示,Meta正在将生成式AI技术融入其所有产品中,并重申了该公司对AI研究采取“基于科学的开放方法”的承诺。达勒也表示:“我肩负着一项艰巨的任务,那就是开发最先进的模型,并以创纪录的速度将它们集成到产品中。”
简而言之:Llama已成为这场游戏的主角。
对于一家年收入高达1350亿美元的公司而言,Meta所采取的策略似乎并不符合常规逻辑。开源软件通常被视为一种技术推广的手段,它更有利于那些与Meta这样的行业巨头竞争的小型初创公司或资源有限的团队。
开源将打破AI垄断,
暗含新的盈利机会
如今,Llama已经经过了一年多的实践检验,扎克伯格的观点在某些人看来颇具说服力。研究Meta的沃尔夫研究公司分析师什维塔·卡朱莉亚(Shweta Khajuria)认为,将Llama作为开源软件发布是Meta的“天才之作”。这一举措不仅帮助Meta吸引了顶尖人才,还加速了其平台的创新步伐,并为其开辟了新的收入来源。她解释说,开源的Llama使Meta能够迅速赶上OpenAI、谷歌和Anthropic等竞争对手,部分原因在于成千上万的开发者正在以惊人的速度对Llama进行构建和改进。她还指出:“如果Meta没有选择开源,那么它可能需要更长的时间才能与其他前沿模型接轨。”
卡朱莉亚相信,Meta未来将拥有众多新的盈利机会。例如,基于Llama的Meta AI功能可能会推出订阅和广告选项,以及AI驱动的应用内商业信息等。她说:“Meta拥有数十亿用户的庞大基础,这是Perplexity、Claude和ChatGPT等竞争对手所无法比拟的。一旦这些AI服务在全球范围内积累了足够的用户和使用量,它们就有可能实现盈利。”
扎克伯格还暗示,AI生成的内容本身将具有巨大的价值。在最近的财报电话会议上,他表示:“我认为我们将迎来一个全新的内容类别,即AI生成或总结的内容,或者由AI以某种方式整合的现有内容。随着时间的推移,这对于Facebook、Instagram、Threads或其他产品中的推荐体验效果来说,将是非常令人振奋的。”
帕特里克·温德尔(Patrick Wendell)是数据和AI公司Databricks的联合创始人兼工程副总裁,该公司于7月在其平台上部署了Meta的Llama 3.1模型。温德尔认为,Meta的这一举措具有更为深远的影响。如果将互联网视为推动Facebook诞生的第一波科技浪潮,而移动时代则是由苹果和谷歌主导的第二波科技浪潮,那么“我认为扎克伯格已经预见到第三波科技浪潮即将到来,他不希望看到只有一两家公司完全控制所有AI的使用。避免这种情况的一个有效方法就是市场商品化,即免费提供核心知识产权,从而打破垄断格局。”
而一些批评者坚决认为Meta根本无权使用“开源”这一术语。他们指出,当前版本的Llama仍包含传统开源软件所不具备的限制,例如用户无法访问数据集。今年10月,开源术语的创造者——“开源促进会”对此提出了批评,指责Meta错误使用了这一术语,导致用户陷入困惑,同时指出谷歌和微软已经放弃使用该术语。
尽管术语的使用存在争议,但Meta在关键领域取得了显著成就。非营利组织艾伦AI研究所的研究科学家内森·兰伯特(Nathan Lambert)表示,尽管开源的定义可能有分歧,但目前超过90%的开源AI模型都是基于Llama构建的。
在Meta内部,Llama与创收业务之间的联系日益紧密。今年1月,扎克伯格将AI研究团队FAIR与在Meta应用程序中部署生成式AI产品的团队整合到了同一个部门。杨立昆和皮诺现在直接向首席产品官克里斯·考克斯(Chris Cox)汇报工作,达勒也是如此。皮诺表示:“将FAIR与应用产品家族结合在一起是非常有意义的。”她指出,即使在重组之前,她的团队所做的研究也往往能在几个月后就应用到Meta的产品中。
小扎控制61%有表决权股份
不惧投资者质疑
然而,并非所有人都对Llama持乐观态度。多年来,扎克伯格和他的公司一直在努力应对公众对其在Facebook、Instagram和WhatsApp上使用其他类型AI进行个性化新闻推送、内容审核和定向广告的不信任。批评者指责其算法加剧了政治两极分化、青少年心理健康危机以及错误信息的传播。因此,Llama可能会面临更加严格的审查。
一些批评人士还担心,像Llama这样的开源模型在恶意行为者手中可能会变得非常危险,正是因为其开放性过高。在当前紧张的地缘政治氛围中,这些担忧可能会进一步加剧。
即将上任的特朗普政府可能会为Llama的开放之路增添更多变数。特朗普的经济民族主义(Trump's economic nationalism)立场表明,他很可能不愿意看到其他国家获得美国制造的最先进AI模型。然而,Llama的未来走向可能取决于特朗普政府内部的不同声音。副总统当选人万斯(JD Vance)过去曾公开表达过对开源AI的支持,而像埃隆·马斯克(Elon Musk)的xAI也已经将其聊天机器人Grok开源。
尽管如此,扎克伯格的一些老朋友对这种AI军备竞赛表示担忧。Facebook的联合创始人、现任Asana首席执行官达斯汀·莫斯科维茨(Dustin Moskovitz)就指出,虽然他不反对开源大语言模型,但他认为不断发布更强大的模型可能并不合适。
然而,扎克伯格及其盟友坚信,开源模型的风险实际上比那些封闭的专有模式要小。他们主张,对开源AI进行过度的监管可能会扼杀创新。扎克伯格和Spotify联合创始人丹尼尔·埃克(Daniel Ek)在今年8月共同撰写的一篇文章中指出,开源开发是“利用AI推动进步、为每个人创造经济机会和确保安全的最佳途径。”
无论Meta的开源行动最终结果如何,扎克伯格都被视为这一变革的关键推动者。内部人士透露,他个人深度参与了推动Llama和开源的工作,这是Meta能够如此迅速和专注发展的关键原因。克莱格表示,扎克伯格是少数几个在创建大型科技公司后依然留任的领导者之一,他的直接参与使得决策过程更加高效。
为了推动这一变革,扎克伯格一直在积极招募AI人才,并亲自参与招募过程。据报道,他曾用个人电子邮件从谷歌DeepMind挖角研究人员,这些邮件中强调了AI对Meta的重要性。
埃里克·梅杰(Erik Meijer)曾在Meta工作了8年,领导一个专注于机器学习的团队。他认为,只有像扎克伯格这样的高管才能实现这种彻底的转变。他比喻说,这就像一艘超级巨轮在转向,需要强有力的领导人来引领整个公司向同一个方向前进。从某种意义上说,扎克伯格在公司内部就像是一个受人崇拜的英雄。
然而,随着资本支出的飙升和Meta的转型,投资者的耐心可能会受到考验。沃尔夫分析师卡朱里亚表示,目前投资者对Meta的转型持容忍态度,因为Meta已经奠定了基础并展示了未来的机会。但如果从2025年到2026年收入没有开始加速增长,投资者可能会开始失去耐心。尽管如此,扎克伯格控制着Meta约61%拥有表决权的股份,因此他在一定程度上可以免受投资者不满的影响。
杨立昆表示,Meta在GPU和生成式AI方面的巨额投资需要一个愿意冒险的领导者。幸运的是,Meta不仅有这样的领导者,还有一个利润丰厚的核心业务来为这一愿景提供资金。因此,Meta再次回到了科技和商业交汇处的对话中心,而这次讨论的重点不再是虚拟化身等边缘话题,而是关于AI的未来及其在商业中的应用。(腾讯科技特约编译金鹿)