FTT大会上，创新工场李开复发言：我坚信公司只有两种命运—全面拥抱AI或破产出局，没有第三条路！

科技 2024-11-01 00:01 北京

在10月30日的FII Institute大会上，多位人工智能领域的领军人物齐聚一堂，其中包括创新工场董事长兼首席执行官、01.AI首席执行官李开复博士，You.com创始人Richard Socher，以及Stability AI首席执行官Prem Akkaraju。

伴随着大型语言模型在理解和生成人类语言方面取得了突破性进展。在此背景下，李开复分享了他对人工智能发展的独特见解。'这一次的AI发展是真实的，'李开复回顾道。作为见证人工智能起伏的资深专家，他分享了自己从大学时期就开始追逐AI梦想的经历。在经历了几次'AI冬天'后，约七八年前，深度学习的发展让他重新看到了AI创造巨大价值的可能。通过创新工场，他们成功孵化了12家AI独角兽企业。而如今，生成式AI的快速发展促使他从投资人转型为积极的参与者，从'后座'走向'驾驶座'。李开复对AI的未来持强烈的确信态度：'在2030年左右，只会存在两类公司：充分利用AI的公司，和已经破产的公司。“

在探讨中美科技竞争时，他指出了两国在AI发展上的独特优势：美国公司在创新和开创性技术上占据优势，而中国公司则在执行力、工程实现、应用开发和用户界面设计等方面表现出色。在这个'发现时代'，虽然美国可能在技术创新上保持领先，但中国企业通过优秀的工程能力和解决方案交付，同样可以在AI浪潮中占据重要位置。

文稿整理

主持人： 大家好，欢迎参加另一场关于人工智能的对话。我觉得我们关于这个话题的讨论还不够。在这里，我要特别感谢 Richard 和 FI 团队，今年他们大大推动了关于人工智能的讨论。我认为没有哪个话题能比这个更重要了，不论是在金融、领导力、教育还是医疗领域，人工智能正在改变我们的一切。今天我们有三位非常出色的 CEO，他们分别代表了人工智能发展中的不同领域。首先，我会请每位嘉宾用一分钟自我介绍，讲一讲他们的工作。然后，我们会探讨这个领域的未来发展速度、规模，甚至还会问问大家在 ChatGPT 之后，人工智能还会怎样发展。Prem，就从你开始吧。

嘉宾Prem Akkaraju： 好的，谢谢你，Peter。我是 Prem Akkaraju，Stability AI 的首席执行官。我们公司是全球领先的开源图像、视频和 3D 模型平台之一。至于 GPT 之后的发展嘛，图片确实胜过千言万语，而我们也在大量生成这些图片。事实上，去年 2023 年所有由 AI 生成的图像中，有 80% 是由我们的模型 Stable Diffusion 驱动的。

主持人： 非常棒！Richard，你呢？

嘉宾Richard Socher： 大家好，非常高兴来到这里。我是 Richard Socher，you.com 的创始人兼 CEO。you.com 是一个生产力引擎，它是继搜索和回答引擎之后的下一代产品。我们的目标是帮助各类组织提升生产力，从对冲基金、大学、公司到保险公司、新闻社等，几乎涵盖了各行各业。我还运营一个名为 ax Ventures 的风险基金，投资早期的人工智能公司和初创企业。在我任教于斯坦福大学时，我有幸遇到两位学生，他们创办了一个叫 Hugging Face 的公司。我在他们 500 万美元的估值时投资了，现在他们的公司已经达到 45 亿美元的市值，所以基金表现不错（笑）。

主持人： 你这可是实打实的炫耀啊（笑），我也希望我能像你一样。李博士，您来介绍一下。

嘉宾李开复： 大家好，我从事人工智能研究已经有 43 年了。我大学时才开始接触 AI，那时我才刚二十岁左右，可能比很多同行的年龄还小。我专注于机器学习领域，持有卡内基梅隆大学的博士学位，也曾在苹果、微软和谷歌工作。可能有些人通过我的书《AI超级智能》和《AI 2041》认识我。我的兼职工作是运营创新工场，这是一家全球性投资机构。而我的全职工作是管理 0. 这是一家生成式 AI 公司，我们构建了大型语言模型，目前在性能上排名第三，仅次于 OpenAI 和谷歌的顶级模型。我们的产品可以在全球访问，我们也积极参与开源项目。

AI生成电影

主持人： 首先，我要说，李开复博士是全球 AI 领域的传奇人物，能够邀请到他非常荣幸。Prem，咱们先从你开始吧。你很有名的一件事就是成功招募了詹姆斯·卡梅隆加入你的董事会。鉴于 Stability AI 正在创造视频、推动好莱坞的未来，我想问两个问题：第一，卡梅隆在《终结者》中描述的未来对了吗？第二，关于好莱坞的颠覆性讨论很多，未来 AI 是否会创作所有电影和内容？

Prem Akkaraju： 哈哈，那就让我们希望卡梅隆在《终结者》里描述的未来不会成真吧！不过那真是一部好电影，他还经常开玩笑说“我早就告诉你们这个未来会来，现在它真的来了”。他为什么会对 Stability 有兴趣呢？这是个好问题。我很幸运能够在我担任 Weta Digital CEO 时，与他一同制作了《阿凡达2》，那部电影花了四年多才完成，因为它是完全渲染出来的。如果我们快进到 5 到 10 年后，我认为绝大多数电影、电视和视觉媒体将不再需要渲染，而是直接生成。在《阿凡达》中，有些镜头花了六千到七千个小时的计算时间来渲染一帧画面，而现在这个过程可以缩短到几分钟。所以，卡梅隆希望能节省很多时间。电影制作的难题在于时间和资金，而他希望打破这些障碍，从渲染模式转变到生成模式。

主持人：那么，我们会不会看到 AI 根据每个人的喜好生成“量身定制”的电影呢？

Prem Akkaraju： 我个人希望不会吧（笑）。我认为创作过程应该由人类主导，人类需要利用这些工具来实现他们的故事。因此，我相信大家依然会喜欢听别人讲述的故事。

主持人： 那好，我们换个方向吧。未来我们会不会看到玛丽莲·梦露等已故明星重新“回归”？既然 AI 能生成绝对逼真的演员和明星，是否还需要真人演员？

Prem Akkaraju： 其实在电影制作过程中，直接拍摄演员的表演反而更快捷，直接拍摄真实的摄影素材更有效。所以我认为 AI 会加强这种表演，但导演和演员之间的互动依然是创作过程的重要组成部分，这种物理性创作的部分不会很快消失。事实上，我经常思考哪些事物不会改变，就像我思考哪些会改变一样。

主持人： 不过我确实认为，在导演拍摄一遍后，他会说“我明白了”，因为他们可以像你所说的那样，通过操控表演来达到预期效果。在继续之前，我还有一个问题想问你：十年后，随着数字超级智能的发展，电影和电视会发生什么最剧烈的变化？你认为娱乐行业最疯狂的前景是什么？

Prem Akkaraju： 我认为我们会看到内容创作量呈现 5 到 10 倍，甚至 20 倍的增长。我们会看到时间形式的多样化，比如你可能希望在睡前花两分钟，或者二十分钟看一部电影。不同时间长度的内容将会出现爆发式增长，而且全球艺术家的数量也会大幅增加。

NLP发展方向

主持人： 十年后我会回来看看你说的对不对（笑）。Richard，我们接下来谈谈你。你在神经网络应用于自然语言处理的早期阶段做了很多开创性工作。你觉得 NLP 的下一个前沿是什么？能否简单解释一下什么是 NLP，以及它未来的发展方向？

Richard Socher： 自然语言处理（NLP）过去是人工智能的一个子领域，但我认为它几乎影响了人工智能的所有其他领域。有许多不同的算法可以训练。2010 年我有一个疯狂的想法：训练一个通用的神经网络来处理所有 NLP 任务。到 2018 年，我们终于构建了第一个模型，开创了提示工程的概念，让人们可以通过一个模型回答所有问题。随着时间的推移，人们可以不仅仅通过文本提问，还可以通过图像提问。因此，我认为 ChatGPT 之后的答案之一就是我们会有更多的多模态模型，能够在图像、视频、声音、编程等不同输入输出模式间无缝转换。其中一个特别有趣但尚未广泛认识的领域是蛋白质。蛋白质本质上是生物学中的基本“积木块”，一切都由蛋白质主导。就像你可以让大型语言模型为你写诗一样，你也可以让它设计特定种类的蛋白质，比如只与 SARS-CoV-2 结合的蛋白质，或只针对脑部特定癌症的蛋白质。这将为医学带来巨大的突破。目前我们看到 DeepMind 的 Alpha Proteo 等项目已经展示了这一潜力。

主持人： 前些时候我们讨论过“智能上限”问题，但我没听到你的答案。我们刚刚在一次关于数字超级智能的讨论中提到这个问题。我们看到 AI 变得越来越智能。昨天我和埃隆聊天时，他说，到 2029 或 2030 年，AI 的智力将等同于全人类。你觉得智力会不断增长到百万倍、十亿倍，甚至兆亿倍吗？是否存在智能的上限？

Richard Socher： 这是个非常有趣的问题。说到 AlphaFold 和 Google 的研究，理解蛋白质如何折叠能帮助我们了解它们在体内的功能和相互作用。2020 年，我们在 Salesforce 的研究团队创造了第一个生成新蛋白质的模型，设计出的蛋白质与自然界已有蛋白质有 40% 的不同。我们在实验室中合成了这种蛋白质，它具有抗菌性质。至于智能上限，实际上要看智力的不同维度。比如语言智能、视觉感知、推理、知识提取以及物理操控等。以视觉智能为例，人类的视觉依赖于电磁频谱，而我们可以预见 AI 将来可以看到更宽的频谱，比如伽马射线频段。但最终我们会遇到物理极限，比如量子物理限制或光速限制。在某些方面，我们离这些上限非常遥远，但在某些领域，我们已经非常接近了。

主持人： 你提到工作效率是 you.com 的目标之一。那么，这是否意味着工作生产力也存在上限？随着 AI 代理人和机器人能够执行几乎所有任务、并自我改进，是否会出现某种“无限 GDP”呢？

Richard Socher： 在某些领域，AI 可以进入自我训练循环，只要有模拟环境，比如国际象棋或围棋，它们可以完美模拟，AI 能够自我训练，进行无数次博弈，解决该领域的所有问题。另一可完美模拟的领域是编程，编程语言的输出可以在计算机中模拟，因此 AI 可以在这个领域不断提升，达到超人级的编程能力。但是有一些领域是无法进行无限次模拟的，比如客户服务。你可能会遇到数十亿客户，他们会询问各种产品使用过程中遇到的问题。在这些领域中，限制因素将是数据的收集。你能否真正将一个流程完全数字化？我常开玩笑说，水管工大概是最安全的职业，不会被 AI 取代，因为还没有人去收集关于如何修水管的数据。想象一下，你要爬到某个地方接不同的管子，现在还没有人用 GoPro、3D 传感器和机器人手臂去收集这种数据，所以这种工作领域的变化将需要更长的时间。

在工作生产力方面，很多人将成为管理者。许多目前作为独立贡献者的员工将不得不学会管理 AI 以完成他们的工作。而管理也是一种技能，不是每个人天生就是好经理。你需要向 AI 解释如何做某种工作。以一家大型网络安全公司 mcast 为例，他们有 200 名用户使用他们的产品。我们与他们的不同团队进行了工作坊交流，向大家解释产品的功能。比如，有人来自市场部门，平时需要将长产品描述写成适合不同行业的邮件，然后再写三条推特和三条 LinkedIn 消息等。我们告诉他们可以直接向 AI 代理人描述这些需求，结果代理人可以为他们完成这些工作，他们感到惊讶，因为原本每两周花费 6 到 20 小时的工作量就这样被自动化了。我认为这种变化将影响几乎所有行业。

中美AI公司差异

主持人： Kai-Fu，我可以向你提出很多不同的问题。首先，创新工场的基金规模有多少？

李开复： 我们管理着大约 30 亿美元的资金。

主持人： 你是最活跃的 AI 投资者之一。我有幸多次访问你在中国的公司，感谢你的热情款待。如今你不仅是投资者，还是一名企业家，经营着一家中国公司和一家美国公司。为什么要这样做？

李开复： 因为这一次 AI 发展是真实的，想象一下，这是我大学时的梦想。当时 AI 并不为人所知，但我觉得这是我应该做的事情。之后我们经历了几次“AI 冬天”，那时大家的热情消退，我也不得不做其他工作。大约七八年前，随着深度学习的发展，我意识到 AI 可以创造巨大价值。不过当时我还看不到通用人工智能的可能，所以我只是作为投资人。通过创新工场，我们成功培育了 12 家独角兽 AI 公司。

但这次生成式 AI 的发展速度令人难以置信，如果我仅仅投资，感觉就像是在“后座”上观望，我希望坐在“驾驶座”上亲自参与。我也希望在座的每个人都有同感。我相信，到2030年末只有两类公司，一类是充分利用 AI 的公司，另一类则是已经破产的公司。我深信这一点。

主持人： 你写了多本关于 AI 的书，比如《AI超级智能》。自那本书出版以来，全球 AI 竞赛发生了什么最大的变化？你认为现在是 AI 军备竞赛吗？

李开复： 可以说是，也可以说不是。因为中国的公司主要在中国市场上互相竞争，并不是在国与国之间竞争，而是公司之间的竞争。

主持人： 那么你怎么看中国公司的特点？

李开复： 在我的书《AI超级智能》中，我提到过，美国公司通常更具创新性，能够开创出新的东西，而中国公司在执行和细节上更胜一筹，擅长工程实现、应用开发、用户界面设计等方面。在移动互联网或深度学习领域，几乎所有技术都是美国发明的，但中国利用这些技术创造了巨大价值，甚至可能超过美国。现在在生成式 AI 领域，技术仍然是美国人发明的，而我们正处于一个特殊的时期，技术在美国及其他地区迅速自我革新。因此，现在依然是“发现时代”，美国有可能赢得这一领域的主导地位，但中国公司可以观察到这些创新，进行部分自我创新，并在工程方面表现得更好，交付解决方案。我正在打造的公司“o1”正在做的正是这一点。我们并不声称自己发明了一切，甚至大部分东西，但我们从硅谷巨头 OpenAI 和其他公司中学到了很多。我们专注于更扎实、更快速的执行。例如，我之前提到过，“o1”现在是全球第三大模型公司，在 UC Berkeley 的评估中排名第六。最令人惊讶的是，我们仅用 300 万美元训练了这个模型，而 GPT-4 的训练费用在 8000 万到 1 亿美元之间，GPT-5 传言则需要约 10 亿美元。我们并不否认规模法则的存在，但优秀的工程细节意味着不必花费十亿来训练出一个卓越的模型。

主持人： 这对在场的观众来说非常重要，因为世界上很多地方没有机会接触到 100,000 个 H100 集群。那么问题来了，我能不能在一个 GPU 资源有限的国家建立一个业务或产品？

李开复： 我认为 GPU 资源的限制确实迫使我们创新。作为一家中国公司，我们首先受限于美国的 GPU 供应管制，其次中国公司的估值远低于美国公司。资金少、GPU 获取困难，这让我深信“需求是创新之母”。在只有 2000 个 GPU 的情况下，我们的团队必须找到最优的使用方式，作为 CEO 的我也需要确定优先级。我们不仅要让训练快速进行，还要让推理过程变快。我们通过识别整个流程中的瓶颈，将计算问题转化为内存问题，建立多层缓存和专用的推理引擎，最终将推理成本降到每百万 tokens 仅 10 美分，这仅是可比模型费用的 1/30。

主持人： 那么，这个 10 美分的成本将带来什么影响呢？

李开复： 10 美分的成本意味着可以用更低的价格来构建应用程序。如果你想构建类似 you.com 或 Perplexity 的应用程序，可以选择支付 OpenAI 每百万 tokens 4.4 美元的费用，也可以选择我们的模型，只需 10 美分，使用我们的 API 只需 14 美分。我们的定价非常透明。

主持人： Richard，有一个叫做“蒸汽机悖论”的有趣现象源于工业革命时期。那时很多聪明人致力于提高蒸汽机的效率，以减少煤炭消耗，他们认为蒸汽机更高效后煤炭需求会减少，但实际上却是蒸汽机需求大幅增加。我认为现在我们正处于“智能悖论”之中，我们将把智能用在更多地方，每个人都会拥有自己的助手和医疗团队，这些助手可以完全理解个人需求，而不再受限于智能资源昂贵的问题。

Richard Socher： 我完全同意。我要澄清一下，我并不是说我们在减少固定的工作量，而是说我们在推动一个更大规模的工作负荷。

AI时代建议

主持人： 在座的很多人都有子女或亲戚，那么对于 20 岁的年轻人，你们有什么建议？尤其是那些刚刚开始学业和职业生涯的年轻人，在人工智能迅速发展的今天你们有什么忠告？

Prem Akkaraju： 我认为不要浪费时间学习编程，因为未来的“编程语言”可能会是英语。我建议尽快学习所有关于 AI 的知识，找到自己的热情，然后选择一个特定的 AI 领域来帮助实现你的目标。

Richard Socher： 我不同意，我认为仍然应该学习编程。编程是理解技术基础的方式之一，可以让 AI 不再像“魔法”，而变成你可以修改和构建的工具。不过，需要将计算机科学和编程与其他兴趣结合起来，尤其是数学、物理和其他科学的基础知识。

主持人： 我要打断一下，我希望留给李博士最后发言的机会。

李开复： 其实我同时同意也不同意你们的观点。我认为人们应该跟随自己的内心。如果你梦想成为一名优秀的程序员，并且擅长编程，那么就听从 Richard 的建议；但如果只是为了赚钱而学编程，那么可以听从 Prem 的建议。

主持人： 女士们先生们，让我们为这三位出色的 CEO 鼓掌！谢谢你们！

原视频链接：https://www.youtube.com/watch?v=3JkkWfzc4Jg&t=47s&ab_channel=FIIInstitute

素材来源官方媒体/网络新闻

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247549619&idx=5&sn=9b8b8a77c291fa6c79a417c7e2029031

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。