观点速读｜YC合伙人圆桌讨论：O1的强大对创业者是双刃剑、万亿参数模型是开启AGI的钥匙

文摘 2024-11-06 08:00 浙江

👇关注公众号后设🌟标，不错过第一手AI新鲜观点和动态

本文所呈现的观点整理自Y Combinator圆桌讨论，公开发表于2024年11月01日。原始内容参考：https://www.youtube.com/watch?v=lbJilIQhHko

Y Combinator简介

Y Combinator (YC) 是全球最著名的创业加速器之一，致力于帮助早期创业公司快速成长。它提供种子资金、导师指导、校友网络以及一系列资源，以换取公司少量股权。

YC 每年举办两期为期三个月的项目，期间创业团队会集中在硅谷（现在也支持远程参与），专注于产品开发和市场验证。 YC 的合作伙伴，都是经验丰富的创业者和投资者，会定期与团队会面，提供个性化指导，帮助他们解决各种挑战，例如产品策略、用户增长和融资。

Demo Day 是 YC 项目的高潮，创业团队有机会向数百位顶级投资者展示他们的成果，从而获得下一轮融资。许多知名公司，例如 Airbnb、Dropbox、Stripe 和 Coinbase，都曾是 YC 的校友，这证明了其在孵化成功企业方面的卓越能力。

YC 的影响力不仅在于资金支持，更在于其强大的社区和资源网络。成为 YC 的校友意味着加入一个由优秀创业者组成的社群，可以互相学习、分享经验，并获得持续的支持。对于有志于改变世界的创业者来说，YC 无疑是一个理想的起飞平台。

圆桌讨论参与者

Garry：YC 总裁兼CEO、合伙人

Harj：YC管理总监、合伙人

Jared：YC管理总监、合伙人

Diana：YC合伙人

核心观点整理

本次圆桌讨论主要围绕OpenAI的O1等强大的大型语言模型(LLMs)对创业者、开发者以及科技未来的影响展开。以下是几个核心观点：

一、强大LLMs如O1的影响是双刃剑：既可能导致垄断，也可能降低AI创业门槛

一方面，O1强大的能力引发了对OpenAI可能垄断AI领域的担忧，如同控制着“未来价值的光锥”。讨论中提到：

★
Harj： 如果O1如此神奇，这对创始人和开发者来说究竟意味着什么？一种说法是这对开发者不利，因为O1可能过于强大，OpenAI会独占所有价值。
Garry：你是说他们会占据所有未来价值的光锥？
Harj：对，就是这样。它将占据所有现在、过去和未来的价值。我的天哪。

另一方面，O1更高的准确性和确定性可以解放创始人从繁琐的提示工程中，让他们专注于用户体验和核心软件开发，从而降低AI创业门槛。讨论中也表达了这种乐观观点：

★
Harj：另一种更为乐观的情况是，我们看到创始人，尤其是在项目期间，花费了多少时间来使提示正常工作，使输出准确无误。但如果它变得更确定、更准确，那么他们就可以把时间花在软件的“基础”功能上。赢家将仅仅是那些构建最佳用户体验并处理所有这些细枝末节的公司。

二、LLM发展遵循规模法则，万亿参数模型可能带来AGI甚至ASI的突破

讨论中多次提到LLM发展遵循“规模法则”，参数数量的增加会带来能力的显著提升，类比GPT-3的成功：

★
Diana：是的，现在作为背景，最前沿的模型，我不知道他们的确切参数数量，但大约在5000亿左右，例如Llama 3，4050亿。……GPT-3.5或3发布时，它大约有170亿个参数。那是两个数量级的提升。我们看到了结果。这创造了这个人工智能公司蓬勃发展的新时代。
Garry：所以这真的是关于数量级的。让我们展望未来。那里有万亿参数的大型语言模型，比今天最先进的技术高出两个数量级。会发生什么？人们真的会抛出查询并实际使用这些万亿参数的模型吗？感觉好像每个标记都要等待10分钟。

他们推测，万亿参数模型可能带来与AGI（通用人工智能）或ASI（人工超级智能）相当的能力，但这需要时间来实现：

★
Diana：所以，如果这种规模法则继续下去，我们可能会预期这种感觉与我们在2022年到2021年那一年转型时所感受到的感觉类似。

三、模型蒸馏和优化是关键，降低AI应用门槛

大型模型的训练和推理成本高昂，模型蒸馏技术将大型模型的能力压缩到更小、更高效的模型中，对普及AI至关重要：

★
Garry：我想这可能是这些拥有万亿参数的模型真正改变人类能力的方式之一。……但GPT-4本身，它变成了4.0版本。OpenAI公司本身现在已经在其API内部启用了蒸馏功能。因此，您可以使用O1。您可以甚至使用GPT-4或4.0将其蒸馏成一个对他们来说更便宜的内部模型，例如GPT-4 Mini。这就是他们的锁定能力。
Diana：是的，我认为这一点讨论得不多，但有趣的是，你拥有这些巨大的模型，比如4000亿或5000亿参数的模型，它们基本上是教师模型，因为它们是用所有数据进行大规模训练的，而且花费了很长时间。它们是教师模型，主模型，用于训练学生模型，这些学生模型更小、更快、更便宜，因为对4050亿参数模型进行推理非常昂贵。

四、LLM市场竞争激烈，OpenAI的领先地位面临挑战

虽然OpenAI最初占据LLM市场主导地位，但Claude、Llama等模型的崛起正在挑战其领先地位。Y Combinator的创业公司数据显示了这种趋势：

★
Harj：如果我们暂时不考虑 OpenAI 的最新融资和最新的 01 模型，那么在开发者和构建者中，OpenAI 似乎正在失去市场份额。他们从一家独大的局面变成了迅速流失市场份额给其他模型。……一些真正引人注目的内容是，仅在六个月内，从冬季批次到夏季批次，Claude 的开发者市场份额从约 5% 上升到约 25%。是的，是该批次公司的 25%。
（每年，Y Combinator 会举办两次为期三个月的加速器项目，称为“批次”（batch））
Harj：有趣的是，也许他们正在回归。Jared，你得到的数据统计是多少？似乎已经有 15% 的批次公司正在使用 O1，即使它尚未完全可用。他们并非只是购买产品。

五、语音AI快速发展，成为重要应用领域

OpenAI的低成本语音API加速了语音AI的应用，尤其在客服和物流等领域：

★
Harj：但说到消费者应用程序，我的意思是，关于OpenAI的另一个令人震惊的事情是发布了像实时语音API这样的东西。超级酷。
Garry： 这真是非同凡响，我认为最能说明问题的是，持续使用的基于用量的定价是每小时9美元。这暗示着某种强大的力量。如果我是宏观交易员，我会对那些严重依赖呼叫中心的国家非常非常悲观。因为你知道，每小时9美元的价格差不多就是呼叫中心的成本。
Harj：这是我们在这一批次中肯定看到的另一个现象，对吧？很明显，语音几乎是一个杀手级应用，可以说是……嗯，我刚和这一批次中的一家公司合作过。至少我的团队，Domove，只是做……某种用于债务催收的 AI 语音，他们的发展势头非常惊人，效果非常好。

六、开发者工具竞争激烈，用户体验成关键

Cursor等新型开发者工具的出现，超越了GitHub Copilot，显示了LLM辅助开发领域的快速创新和竞争，也表明优秀的用户体验至关重要：

★
Diana：在此次人工智能浪潮之前和之后，情况大相径庭。……但是，我们在这一批次中看到的创始人构建的演示和产品具有更高级别的精致程度。……许多人可能正在使用诸如 Cursor 之类的东西，对吧？
Garry：当我们询问创始人时，Jared 也指出了这一点。……这一批次中有一半的人正在使用 Cursor，而只有 12% 的人正在使用 GitHub Copilot。这让我很惊讶。……仅仅是从 GitHub Copilot 转到 Cursor，这是在 AI 实际执行的操作量方面的一个进步，就是一个令人难以置信的突破。
Harj： 这是另一个表明创始人为什么拥有优势的迹象。……而 Cursor 却不知从何处冒了出来，在这一批次中，其云用户数量是 GitHub Copilot 的五倍。这再次印证了您之前所说的，创业创始人实际上通常是这类事情的引领者。

七、 AI的长期影响仍存在不确定性，需关注用户体验

讨论最后也强调了AI长期影响的不确定性，以及用户体验的重要性。即使拥有强大的底层模型，最终的成功仍然取决于优秀的用户体验和软件开发细节：

★
Harj：乐观来看，随着模型越来越强大，最终的赢家将是那些构建最佳用户体验并能处理所有细枝末节细节的公司。这就是Cursor能够超越GitHub Copilot的原因所在，它拥有所有优势。
Garry：对于开发者工具来说，绝对有意义。Stripe 和 AWS 都想拥有 Y Combinator 的特定批次，这对他们来说非常有效。所以，对于 Cursor 来说，他们在 Y Combinator 批次中拥有如此高的渗透率，这可能是一个非常好的信号。

名词解释:

AGI (通用人工智能): 能够理解、学习和应用知识以解决任何智力问题的机器智能。与专注于特定任务的弱人工智能不同，AGI旨在拥有与人类相当或超越人类的认知能力。
ASI (人工超级智能): 其智能水平远远超过人类的任何人工智能。ASI被认为具有潜在的风险和机遇，其能力可能远远超出人类的理解和控制。
提示工程 (Prompt Engineering): 是指精心设计输入到大型语言模型中的提示或指令，以引导模型生成期望的输出的过程。它需要对模型的特性和局限性有深入的理解。
模型蒸馏 (Model Distillation): 一种模型压缩技术，通过训练一个较小的“学生”模型来模仿一个较大的“教师”模型的行为，从而降低模型的大小和计算成本，同时保持较高的性能。

👇关注公众号后设🌟标，不错过第一手AI新鲜观点和动态

往期精选

http://mp.weixin.qq.com/s?__biz=MzA5NTU4NDM2MA==&mid=2650003390&idx=2&sn=c00f0b1e1dca0f59c01e96836354b579

瓜哥AI新知

紧追AI业界一手观点、访谈、动态，点滴构建AI底层认知

万字图文｜微软CEO纳德拉在Ignite2024主题演讲：发布Copilot UI+设备+技术栈三大平台战略

速递｜微软VP在Ignite大会中接受专访：微软AI代理已满足企业级应用、提供预定义的智能体+1800模型+1400连接器

全程图文｜黄仁勋在SC24大会宣布英伟达AI集群产品路线图、全行业应用、与谷歌合作量子计算

深度｜资深AI产品总监谈如何成为top5%AI产品经理：能用AI工具动手构建真实产品、拥有超凡能量、能在迷茫中享受探索的乐趣

AI新闻早报｜英伟达Blackwell芯片过热问题导致交付延迟

AI新闻早报｜月之暗面发布Kimi新数学模型k0-math，多项指标超O1

深度｜Perplexity用户增长主管揭秘用户暴涨的奥秘：专注用户留存、重视口碑传播、慎用付费推广

观点｜微软AI CEO苏莱曼：我们正处于AI技术过剩、技术突破多于实际应用，2025实现AI记忆

深度｜艾尔街资本《AI现状报告》作者专访：OpenAI和闭源模型占有压倒优势、投资英伟达比投资竞对赚钱得多

AI新闻早报｜马斯克再次起诉OpenAI及其合作伙伴微软

全程图文｜黄仁勋日本峰会主题演讲&对话孙正义：孙正义痛悔英伟达股票卖早了、与软银合作建设25艾字节AI超算

AI新闻早报｜OpenAI将于2024年1月推出名为“Operator”的自主AI代理

3万字实录｜谷歌前CEO施密特：AI时代公司经营的根本问题是如何用AI加速工作、AI带来剩余财富但改变不了人类的自私

2万字硬核｜Anthropic研究员克里斯：模型可解释性如同研究生物学、什么会刺激模型撒谎或作恶？

AI新闻早报｜Nvidia与软银深度合作开发日本最强超算、通义千问离职骨干因竞业被索巨额赔偿

3万字全文｜Anthropic安全对齐主管阿曼达接受莱克斯专访：人应该如何与AI对话、AI与人类会产生亲密关系吗？

红杉｜实时AI游戏Oasis掌门人迪恩：追逐裸金属级别的极致性能、定制专属CUDA内核和模型架构

AI新闻早报｜百度世界大会发布检索增强文生图技术iRAG和无代码开发工具“秒哒”

深度｜黄仁勋对话高盛CEO：每天睡3小时推动Q4批量交付Blackwell、将数百兆瓦级数据中心改造为全液冷

深度｜Perplexity CEO谈AI搜索快速迭代：产品试用代替评审会、每日查询量为核心驱动指标、广告模式探索中

AI新闻早报｜据传OpenAI新模型Orion进步不及预期、月之暗面创始人被投资人提起仲裁

5万字全文｜Claude之父阿莫迪接受Lex专访：2027部署千亿美元AI集群、支持数百万AI代理以人类百倍速度学习和行动

AI新闻早报｜OpenAI华人研究副总裁翁荔离职、AI初创公司Osmo实现气味数字化

深度｜Airbnb CEO切斯基解析“创始人模式”实操秘诀：CEO成为首席产品官、招聘高绩效人才、打造杰出组织

观点｜方舟基金掌门人木头姐伍德，谈懂王第二任期经济和高科技发展预测

观点速读｜Keras之父肖莱：规模不等于智能、模型会通过记忆作弊、智能是通过有限数据习得新技能

AI新闻早报｜谷歌推出带故事板的AI视频制作工具Vids、人形机器人创作的肖像画在苏富比超100万美元价格成交

万字全文｜奥特曼与YC总裁对谈OpenAI创业历程、预测未来公司可能是1人+10000GPU

AI新闻早报｜微软微软发布Magentic-One开源多智能体AI平台、OpenAI重金购得chat.com域名

AI新闻早报｜Nvidia推出AI机器人开发工具、Perplexity完成5亿美元融资

万字全文｜OpenAI和Anthropic两大产品官对谈：AI发展方向是自主性和异步性、当前模型受限于评估而非智能

全球顶级CEO圆桌讨论AI未来：不搞AI死路一条、2032年AI系统达到90%各行业顶级专家能力

AI新闻早报｜Llama现允许美政府用于军事用途、腾讯推混元3890亿参数开源模型

观点｜油管大V Asianometry直击AI创业泡沫：高估值低营收高成本、靠名人效应圈钱、投资人不怕泡沫破裂但员工担心饭碗

观点速读｜YC合伙人圆桌讨论：O1的强大对创业者是双刃剑、万亿参数模型是开启AGI的钥匙

AI新闻早报｜OpenAI O1正式版预发阶段意外泄露后紧急关闭，正待美国选举结束

万字全文｜OpenAI DevDay奥特曼专访：模型是贬值资产、AI按处理问题的计算量定价、从追求10%增长转向10x增长、

高端对话｜黄仁勋vs杨元庆：AI代理和机器人将成为产业世界两大基础、联想推Blackwell新架构AI服务器和车载AI

AI新闻早报｜AI实时生成游戏模型Oasis遭吐槽、OpenAI宣布推迟GPT5/Sora/DALL-E升级

a16z投资巨擘霍洛维茨：AI变革规模类似微处理器浪潮、新型创业者有物理学背景、注重系统属性胜过技术细节

OpenAI离职主管布伦达奇收封口费后接受专访：AI完全没有装“刹车”，人们应该多存钱准备提早（bei）退休

深度｜微软AI CEO苏莱曼：三年内前沿模型性能提升不会放缓、2025实现AI永久记忆、创业者应关注垂直小模型

AI新闻早报｜Cerebras展示“晶圆规模推理引擎”，提供2100token/秒推理速度

速递｜OpenAI CEO Altman和一众高管在Reddit上答网友问（奉上精选截图、字有点小包涵）

红杉专访｜前谷歌搜索老炮、Glean CEO谈企业搜索引擎和RAG技术栈构建实务：AI如何管理企业的知识

AI新闻早报｜OpenAI推出AI搜索、o1模型升级亮相伦敦Dev Day

Claude在computer use开的第一炮，可能炸出一条AI代理突围的新赛道

访谈实录｜Perplexity CEO与资深编辑激辩剽窃指控、瞄准搜索广告商业模式、还在为美国绿卡奔波努力

深度｜马斯克揭秘Neuralink：控制AI风险需突破人机交互带宽瓶颈，大脑输出带宽<1bit/秒

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉