深度|硅谷孵化器YC高管圆桌会议,复盘2024硅谷AI创业热潮

文摘   2024-12-14 07:50   浙江  

👇关注公众号后设🌟标,掌握第一手AI新动态


本文内容整理自Y Combinator高管的圆桌会议,公开发表于2024年12月13日。原始内容参考:https://www.youtube.com/watch?v=z0wt2pe_LZM

内容提要: Y Combinator回顾2024年AI创业热潮
  1. AI初创公司发展迅猛: 2024年AI初创公司发展速度惊人,许多公司在24个月内即可实现数千万美元收入,且投入资金相对较少(200万-500万美元)。这种快速增长在Y Combinator (YC) 的孵化项目中尤为明显,部分公司甚至在YC期间增长了3倍。
  2. 开源模型的崛起与多模型架构: 开源模型,特别是Llama的出现,打破了大型语言模型公司(如OpenAI)的垄断预期。许多成功的AI应用并非由OpenAI构建,而是基于开源模型构建,并采用多模型架构,根据不同任务选择最合适的模型,提高效率和性能。模型路由器和模型编排成为新的技术趋势。
  3. 企业试点项目转化为实际收入:  过去对AI试点项目能否转化为实际收入的质疑已被打破。2024年,大量的企业试点项目成功转化为实际收入,且销售周期和收入增长速度远超预期。
  4. 垂直AI的蓬勃发展: 垂直AI应用的价值主张非常强大,投资回报率高,推动了快速发展。不同行业对AI的需求存在差异,催生了大量针对特定垂直领域的AI应用。
  5. AI的可靠性提升和“代理”概念的兴起: 通过技术改进,AI的可靠性显著提升,使得大规模企业部署成为可能。 “代理”成为一个重要的概念,AI被应用于解决各种复杂任务,而非简单的聊天。
  6. AI编程的爆发式增长: AI编程工具(如Cursor)的出现,极大提高了程序员的效率,改变了编程面试和公司招聘方式,并可能影响到未来公司规模和人员配置。
  7. 机器人技术的潜在爆发:  大型语言模型为机器人技术提供了“意识”,但硬件成本和技术难题仍然是挑战。  自动驾驶汽车的部署被认为是机器人技术领域一个重要的潜在突破点。
  8. 增强现实(AR) 技术的进展缓慢: 尽管AR硬件有所发展,但其应用场景和用户体验仍有待提高,硬件成本和技术瓶颈是主要限制因素。
  9. 大型公司(如OpenAI、Scale AI)的巨额融资:  大型AI公司获得巨额融资,进一步推动了行业发展,但同时也反映了行业竞争的激烈程度。  Scale AI的成功案例,展现了初创公司如何通过敏捷转型和抓住市场机遇实现快速发展。
  10. 线下活动的回归:  线下活动和面对面交流重新兴起,尤其是在YC的演示日中体现。

Y Combinator简介

是一个美国创业孵化器,成立于2005年,由保罗·格雷厄姆(Paul Graham)、罗伯特·莫里斯(Robert Morris)、杰西卡·利文斯顿(Jessica Livingston)和特洛伊·麦卡锡(Trevor Blackwell)共同创立。它以其独特的孵化模式和对硅谷乃至全球科技产业的影响而闻名。

Y Combinator 的核心是其为期三月的加速器项目。参与的初创公司(通常被称为“batch”)会收到种子资金,并参加一系列讲座、研讨会和一对一辅导。这些辅导通常由经验丰富的创业者和投资者提供,帮助初创公司打磨产品、完善商业模式,并为融资做准备。

圆桌会议记录

加里:  欢迎回到新一期的“光锥”。我是加里,这是贾里德、哈吉和黛安娜,我们共同资助的公司在早期就价值数千亿美元。所以,2024年,真是意义非凡的一年。哈吉,你对此感觉如何?

哈吉:  感觉很棒。我认为今年是所有事情都对初创公司有利的一年。我最近一直在思考的是,两年前ChatGPT推出时,当时普遍的看法是所有的价值都将归于OpenAI。

还记得他们宣布GPT或ChatGPT商店的时候吗?是的。我记得当时普遍认为,所有建立在ChatGPT之上的东西都只是一个GPT外壳,而应用商店将会发布并碾压所有试图构建AI应用的人。OpenAI将会成为一家巨无霸公司,但初创公司将没有机会。现在说这些听起来有点可笑。谁还记得ChatGPT商店?没错。ChatGPT商店本身就是一场空。

但更重要的是,如今主要的AI应用有哪些?我觉得除了ChatGPT本身之外,突破性的消费者应用是Perplexity。突破性的企业应用可能是Glean。在法律科技领域,你有CaseText和Harvey。对于专业用户,你有PhotoRoom。关键是,有很多应用不是由OpenAI构建的。现在是创办初创公司的绝佳时机。

加里:  是的,现在最疯狂的事情是,你可以创办一家公司,在短短24个月内就能从零赚到数千万美元。而且你只需要投入可能200万美元、500万美元。这就是其中一家公司OpusClip的故事,它从来没有进行过真正的A轮融资。这也是我们在YC社区看到的普遍现象。

哈吉:  是的,我认为非常重要的一点是,你可以作为一家初创公司做到这一点,而无需筹集大量资金。因为在GPT商店推出后,我记得Anthropic和Claude也出现了。当时普遍的看法是,所有价值都将归于这些基础模型公司之一。在AI领域竞争的唯一方法就是筹集大量资金,要么你有风险投资,要么你是像亚马逊、Facebook或谷歌这样拥有大量现金的公司。但如果你不是大型基础模型公司之一,就不会有任何价值。建立在这些基础模型之上的应用要么由基础模型公司自己构建,要么就没什么价值。事实证明,这完全不正确。特别是什么促成了这种情况呢?开源,比如一系列奇怪的事件,权重被泄露了,然后Meta就存在。

黛安娜:  对。这有点迫使Meta推出了Llama,这很有趣。人们认为,哦,这只是一个很酷的开源模型,但它比OpenAI落后了18个月。

结果,人们开始在此基础上进行大量衍生工作,包括Vicuña和所有其他与Llama相关的动物都出现了。这也让老牌的Llama,也就是YC的一家公司,能够让人们进行本地Docker开发,比如在设备上运行模型。这很酷,但人们认为他们无法赶上。

从2023年到2024年的转变是,在夏季,这是一个转折点。这是Llama首次在所有排名和基准测试中成为顶级基础模型。这让整个社区震惊了。

加里:  是的,所以事实证明,选择很重要。而选择意味着,它不完全是关于模型本身的。我认为模型仍然非常重要。但是一旦你在模型方面有了选择,就意味着你不能有垄断定价的想法。你有这个模型,你的竞争对手也有这个模型,但其他的事情似乎变得更重要了,比如产品,你的销售能力,你实际调整用户反馈的能力,你实现零客户流失的能力。所有这些突然变得比通过模型捕捉未来所有价值的光锥更重要。

哈吉:  我对此感受特别深的一个方面是,我记得一年前,我与批次中的初创公司合作,他们基本上在构建模型路由器,就像一个调用特定模型的API。我记得当时的主要动机是降低成本。比如,“哦,你不想把所有的ChatGPT调用都用完。你想把它们分散到各种不同的模型上。”而反对它的观点是,“哦,所有这些东西的成本都在降到零。成为模型路由器没有任何价值,没有人想用模型路由器构建他们的应用程序。他们都只会调用最好的模型。”我觉得快进一年,情况完全不是这样。据我所知,模型路由器实际上是一个很好的切入点,可以构建一个用于构建LLM驱动的应用程序的新堆栈。而且我们看到的大多数应用程序,我认为他们只是不想受制于特定的模型。这和您看到的情况一致吗?

黛安娜:  是的,实际上,我们在刚刚在演示日展示的秋季批次中看到的一个趋势,也就是从24年夏季到24年冬季发生的变化,正是您所说的。公司开始在其应用程序中使用多个模型,在某些时候选择最快的模型来提高速度,因为有时你需要非常快速地解析大量输入。如果稍微有些损失也没关系。然后你需要更大的模型来处理更复杂的任务。

因此,24年秋季的许多公司都采用了这种多模型架构,以便为每个特定任务利用最佳模型,这与模型路由器的概念类似,但已经发展了。它已经从更多关于路由转向了编排。我们之前几期节目中提供的一个具体例子是您合作的公司Camfer。他们使用最快的模型来解析PDF,并使用更复杂的O1模型来处理其他任务。

此外,其他公司正在将这种方法应用于欺诈检测。他们创造了一个初级风险分析师的概念,他们使用快速简单的GPT-4o mini,然后使用更复杂的O1模型进行更深入的分析。另一个例子是Cursor,他们在与Lex Friedman的节目中讨论了他们复杂的多架构,其中使用了多个模型。他们专门使用一个模型来预测您接下来要输入的内容,另一个模型来理解整个代码库。这说明了可以使用这种方法解决的非常不同的任务。所以这绝对是现在正在发生的事情。

加里:  是的,关于秋季批次,还有一件事值得一提,我正在和一家名为 Variant 的公司合作。他们尝试做的事情是,基本上利用最先进的开源LLM模型进行代码生成,然后教它们美学,从图标生成开始。

他们构建了一个庞大的后训练工作流程,这个流程应该可以适用于,你知道的,随着开源模型在代码生成方面变得更智能、更好。他们可以直接采用下一个版本的模型,然后使用他们的后训练架构和数据集来教给模型特定的美学。这意味着理解某个东西应该是什么样子,而不是以扩散的方式,而是实际上在SVG层面。

我们认为SVG实际上可以转化为各种美学。所以这是一个很有趣的方法,也是一种较新的方法,在这种后训练中,它提供了一种连贯的方式来避免所有价值都积累在模型中的想法,尤其是在开源的情况下,正如你所说。

哈吉:  另一件我一直在回想的事情是,一年前,我记得批次中的许多初创公司都会获得一些企业概念验证或试点项目。当时很多人都对此持怀疑态度,怀疑这些试点项目是否会转化为真正的收入。这和加密货币有很多相似之处,每当出现一些新的有趣技术时,更具体地说是区块链而不是加密货币,企业总是想要运行试点项目和概念验证,因为这是某人的工作,用来勾选“我们做了这个热门的新技术”的清单。

加里:  首席创新官必须有这项工作。

哈吉:  我们好像在其中一期节目中讨论过这个问题。而快进一年,我想我们都有第一手的经验,这些试点项目已经转化为真正的收入。而且,如果说有什么不同的话,那就是现在YC批次中的初创公司将比以往更快地向大型企业销售产品,并且收入增长更快,达到百万美元ARR等里程碑的速度也比我见过的任何时候都要快。

加里:  是的。秋季批次实际上又做到了这一点,实际上,我认为我们第一次注意到这一点是在今年夏季批次的时候。我们意识到的一件有趣的事情是,你还记得保罗·格雷厄姆曾告诉我们,在YC批次期间,你需要以多快的速度增长吗?每周10%。每周10%。最疯狂的是,在夏季和秋季批次中,这两个批次的整体增长率就是这样。哇。所以,这我认为从来没有发生过。这意味着在YC期间增长了3倍。是的,在YC期间增长了3倍,我认为这实际上从来没有发生过。

黛安娜:  平均来说。平均来说。只有最好的公司才能做到这一点,也就是排名前四分之一的公司,对吧?

加里:  是的。

哈吉:  总的来说,一个普遍的趋势是,达到1亿美元年收入所需的时间正在缩短

加里:  是的。不仅如此,我们最近还和本·霍洛维茨共进了晚餐。还记得他说他们刚开始安德森·霍洛维茨时,当时的普遍认知是,在任何一年,只有15家公司能够达到1亿美元的年收入。他们说他们统计了过去20年的数据,发现每十年,实际能够达到1亿美元的公司数量都会增加10倍。所以,20年前可能只有每年15家,我的意思是,我们现在谈论的是每年有1500家公司有真正的机会达到这个数字。当你把这个数据和我们在夏季和秋季批次中看到的情况结合起来时,这并不令人惊讶。

黛安娜:  而贾里德在我们的上一集中提出了一个很好的论点,即垂直AI将如何使1500多家公司蓬勃发展

贾里德:  是的,这就是它增长如此之快的原因。这是因为这些产品对公司的价值主张非常强大,它们就像从货架上飞走一样,因为公司都很聪明,他们可以进行投资回报率的计算。当投资回报率非常高时,人们所相信的关于企业销售周期以及获得大型企业交易需要多长时间的那些真理就会被抛之脑后,因为公司都很聪明,他们会做出理性的决定。你知道,哈吉,我还想到了另一种对初创公司有利的情况。现在都很难记起来了,但一年前,人们经常说的一件事是,这些LLM不够可靠,无法在企业中部署。它们会产生幻觉。

哈吉:  是的,这就是为什么很多人说这些试点项目和概念验证不会转化为真正的合同,因为对于人们来说,这是一种风险太高的技术,无法真正部署。

贾里德:  是的。而且,它不仅转化为真正的收入,还转化为真正的大规模部署,每天处理数千个工单。我认为这是因为我们已经学会了如何通过杰克在这里时谈到的那些技术来使代理变得可靠。而且围绕这些模型建立起来的所有基础设施,使人们能够让它们变得可靠。

黛安娜:  这实际上是一个大趋势。今年,人们更多地将AI视为代理。这是一个今年涌现出来的术语。它去年并没有在谈话中出现。去年更多的是关于很多像聊天一样的东西。ChatGPT,我的意思是,那是它的一种衍生,但现在你把它重新混合成一堆用于XYZ的代理。

哈吉:  而且我们,我的意思是,加里刚刚发布了一个关于Claude计算机使用的精彩解释视频,但是模型的功能一直在朝着能够做复杂的、多步骤的事情,并且能够接管你的计算机、调用其他应用程序并执行复杂的任务的方向发展,这些任务在一年前似乎是不可能的。

加里:  那么监管呢?看起来我们在1047号法案上算是躲过了一劫。而且拜登的一些行政命令似乎不太可能在特朗普白宫中存活下来。目前还不知道,这从长远来看意味着什么。但当然,我们非常担心的一件事是,某些数学运算超过一定水平会突然变成非法,或者需要在当地办公室注册。

哈吉:  现在身处科技行业确实很奇怪,因为我从未经历过软件和技术与政治如此紧密地交织在一起。尤其是,我不太习惯于真正关心国家政治对YC批次中的初创公司或仅仅成立不到一年的公司产生影响。但有一段时间,这确实令人担忧。我们不清楚初创公司是否能够构建创新的AI应用程序,还是会因为OpenAI和少数大公司的监管俘获而遭受损失。我们显然很高兴它朝着有利的方向发展了……

加里:   我个人是看好初创公司的。 感觉我们现在还处于早期阶段,对吧?我的意思是,很容易看到这些平台本身真的会或者有可能像Win32垄断一样,对吧?Windows可以访问API。 实际上,他们知道在其平台上运行的所有统计数据。你猜怎么着?他们可以将其构建到他们的平台中。你知道,我们现在在2024年似乎都松了一口气,但说实话,现在一切都充满变数。这些事情变化太快了。我不会就此完全放松警惕。我们必须继续努力。

哈吉:   好的,所以对于初创公司来说,这显然是很棒的一年。还有什么其他的事情发生吗?我们认为,对于谁来说,今年也是很棒的一年呢?肯定有一些大型的融资轮,对吧?比如OpenAI,不出所料,筹集了巨额资金。还有Scale。是的,即使在YC内部,我们也看到像Scale AI这样的公司今年真正脱颖而出。

加里:   OpenAI融资了60亿美元,Scale融资了10亿美元,SSI,Ilya Sutskiver的新公司,也融资了10亿美元。

哈吉:   关于Scale,我认为值得好好谈谈,因为它是一个非常经典的初创公司故事。我的意思是,你早期就在那里,对吧?你曾经面试过他们加入YC,嗯,请告诉我们他们当时面试时的想法是什么,以及他们是如何最终确定了现在可能算是过去十年中最好的初创公司想法之一的。

贾里德:   Scale.ai的故事有趣的地方在于,它就像是典型的YC初创公司故事的缩影。当然,也有其他类型的初创公司出现,比如SSI,它就不是典型的YC初创公司故事,而是由一些非常有名望的人通过一份PPT演示就筹集了10亿美元。 但像Scale.ai这样的公司,就是一个经典的例子,说明了年轻的程序员如何通过比其他任何人都更聪明、更努力地工作,逐渐建立起一家价值100亿美元的公司。是的,当Alex在YC面试时,他并没有从事任何与人工智能相关的工作。这是一个完全不同的想法。而Scale.ai的想法,有点像是被市场拉出来的。实际上,它经历了多次转型,因为在YC的最初想法与人工智能无关。然后,很长一段时间,他基本上都在为自动驾驶汽车做数据标注。

哈吉:   我记得他们当时申请的项目是一个与医疗保健相关的想法。

贾里德:  是的,是一个预订医生的网站。

哈吉:  好的。嗯,很酷。然后他们在孵化期间转型了。是的。你还记得他们是怎么想到数据标注这个想法的吗?因为这应该是在2016年吗?

贾里德:   是的。他们想到数据标注这个想法是因为Alex曾在Quora工作过,而Quora需要做一些数据标注来用于审核之类的工作。当时,最大的数据标注服务是Amazon Mechanical Turk。当时人们认为它是不可战胜的,因为它由亚马逊运营,亚马逊可以投入无限的资金。而且它一直都处于大规模运营的状态。但是Alex有一个独特的见解,那就是他实际上在Quora使用过Mechanical Turk,并且他知道它用起来真的很糟糕。因此,他对世界有这种独特的洞察力。所以他试图建立一个更好的Mechanical Turk,基本上就是他自己在Quora时想要的版本。

哈吉:   我记得,他们早期的发展几乎完全来自于一个客户,

贾里德:   是的,这个客户需要对汽车在旧金山行驶时拍摄的所有图像进行大量的数据标注。比如在交通灯周围画一个圆圈之类的。Scale的酷炫之处在于,他们实际上抓住了两次浪潮。所以他们,你知道,意外地抓住了第一波自动驾驶汽车公司的浪潮,因为当时机器学习在计算机视觉领域兴起。人们对训练集所需的标记数据有着前所未有的需求,而这种需求以前是不存在的。因此,他们得以乘上这股浪潮。然后,当这股浪潮即将达到顶峰时,大型语言模型(LLM)开始兴起,所有这些公司都需要大规模地进行RLHF。而Scale恰好处于完美的位置,可以进入这个业务领域。

哈吉:   是的,我认为Scale的故事非常有趣,因为它是在大型语言模型出现之前就存在的;它本来就是一个价值数十亿美元的企业。然后它又抓住了大型语言模型的浪潮,现在可能会发展成为一家价值千亿美元以上的公司。我也在基层看到了这种情况,很多我认识的公司,可能在孵化结束之前,甚至在孵化开始之前,都没有什么好点子,后来转型到了一个人工智能的想法,然后就起飞了。

我看到更多的成功案例,是那些等待时机,找到了之前找不到的好点子的创始人。我有一家一年前的公司,他们错过了整个孵化期。他们找不到一个好点子。实际上,在孵化期结束六个月后,他们才意识到他们的一位父母经营着一家牙科诊所。

于是他决定去诊所看看是否有任何可以自动化的东西。他们最终为牙科诊所构建了一个人工智能后台办公系统,现在他们的每周增长速度非常惊人。它做得非常好,我看到很多类似的案例涌现出来。

黛安娜:   我肯定也看到了这一点。我认为这与拥有一群非常努力的年轻技术创始人有关,他们愿意孤注一掷,全力以赴,即使只是看到一点点曙光,觉得“哦,这可能是未来的方向”,就去尝试。然后它实际上最终成功了。你知道,你说的那个关于牙医的故事,我也有很多团队也转型到了不同的领域,他们也在那里找到了曙光。比如,“哦,计算机应用出来了。”我有一些公司正在朝着这个方向努力和投入,而且效果很好。我的意思是,现在还处于早期阶段。我的意思是,这只是秋季班,但也非常酷。

哈吉:   好的,那么我们看到的趋势有哪些?或者说,初创公司在孵化期间所经历的一些具体趋势和浪潮有哪些?我们讨论过语音人工智能。显然,就原始增长势头而言,它可能是目前人工智能领域最有前途的垂直领域。

加里:   你认为语音领域会赢家通吃,还是会发展成针对特定垂直领域的数百个不同分支?这实际上是我从一些语音人工智能初创公司那里得到的问题之一。他们会问,我应该横向发展,还是应该继续在我所在的垂直领域发展?

哈吉:  我觉得语音本身就像人工智能一样。语音触及一切,并且有如此多的不同应用,以至于可能有无限的应用可以构建,而语音是其中有趣的关键要素。我的意思是,比如随便想到的,像语言学习应用程序。我确信不会只有一个真正酷的、人工智能驱动的语言学习应用程序,可能会有多个。远程工作,像远程会议,可能也是另一个可以用语音人工智能做有趣事情的领域。

黛安娜:  甚至在客户支持领域,我们也强调了上次讨论的一些公司,像Power Help公司和Kappa.ai。

贾里德:  是的,事实证明,客户支持并不是一个单一的垂直领域。它有很多不同的“风味”,一旦深入细节,内部差异就很大。

黛安娜:  因为我认为每个行业都需要非常特定的工作流程。这正是垂直人工智能代理将会蓬勃发展的原因。语音也是如此。不同行业的工作流程差异很大。如果你为航空公司构建语音代理来进行客户支持,那么它与为银行构建的语音代理非常不同,与为B2B SaaS公司构建的语音代理也大不相同。

加里:  是的,我想关于是否存在纯粹的横向整合的问题,就像在问,会不会只有一个网站一样?

哈吉:  是的。这就像在说,只会存在两者。会有横向基础设施公司在垂直应用领域做得很好。否则就相当于说,哦,Stripe为互联网上的支付提供动力,并且它也将拥有互联网上接受支付的所有最有价值的应用程序。事实并非如此。仅作为横向基础设施层就足够有价值了。因此,我确信会有很棒的语音人工智能公司,它们能让你很容易地构建自己的语音人工智能应用程序,同时也会有数百个非常有价值的垂直应用程序。

黛安娜:  除了这些,我们还看到了哪些其他趋势?

哈吉:  我们之前在谈论机器人技术。今年,我们肯定在与比以往任何一年都多的机器人领域的创始人合作。比以往任何一年都多。是什么在推动这一点?

加里:  我有一个前苹果团队,叫做Weave Robotics,他们打算在2025年推出一个真正的机器人。它的成本大约是65,000美元到70,000美元。但这实际上是在你的家中让它工作所需的执行器和安全措施的成本。我认为这实际上是由这样一个想法驱动的:大型语言模型(LLM)本身可以作为机器人的“意识”。比如,我在做主人需要我做的事情吗?我如何与他们以及家里的其他人互动?但有趣的是,然后,像折叠衣物这样的语音语言动作模型,几乎可以看作是更广泛的LLM意识内部的工具使用。所以我认为这是我很期待看到的事情之一,它真的会奏效吗?我认为今年我们会找到答案。

黛安娜:  我想我是这样看待的,机器人技术基本上是人工智能和硬件各占一半。这个等式的一半开始奏效了。

加里:  嗯,硬件仍然很难。硬件仍然很贵。是的,有一些证据表明,能够实际做洗衣等事情,可能是最先取得进展的事情之一。

哈吉:  我认为初创公司的理想情况将是,你只需构建其中的人工智能或软件部分,并在通用硬件上运行它,就能完成非常出色的工作。相反的情况是,如果你需要在硬件和软件方面都很出色,并且它们是耦合在一起的,你需要同时生产这两者,那么你就会认为特斯拉是这个领域显而易见的赢家,但结果还有待观察。我对此持乐观态度。我觉得我们有多家公司正试图在如何为特定用例在通用硬件上运行模型方面发挥创意。

贾里德:  感觉仍然很早期。感觉机器人技术还没有迎来它的ChatGPT时刻。

黛安娜:  也许这个时刻是自动驾驶汽车已经在旧金山运行了。我认为这还没有被足够地讨论。

贾里德:  不住在旧金山的人,或者说,经常不意识到它们在旧金山已经完全部署,并且普通人经常乘坐它们。

哈吉:  是的。我最近见到DoorDash的Tony,他说他到处都只用Waymo。我住在帕洛阿尔托,没有选择,但我很想用。

加里:  这会很棒。我的意思是,令人震惊的是,目前全世界只部署了几千辆这些车。而且它们都在旧金山,这是多么幸运啊。嗯,关于2024年的重大失败呢?我好像记得我们有一期Light Cone节目,我们都戴着苹果Vision Pro和Quest。然后我们再也没有谈论过AR。Diana,发生了什么事?

黛安娜:  它还没有实现,很多硬件需要更轻便,我们需要达到这种外形尺寸,但是实际上在物理上有限制,无法将所有硬件都放入这么小的外形尺寸中,并且为了拥有足够的计算能力和光学器件来配合,这非常具有挑战性。我认为仍然需要发现更多的实际工程和物理学知识。我认为算法已经存在,但只是有很多非常困难的硬件和光学问题。

贾里德:  这是一个艰难的鸡和蛋的问题,因为没有足够多的硬件在人们手中,不值得应用程序开发人员构建应用程序。因此,没有足够的应用程序让人们想要购买硬件。

哈吉:  而且我觉得那些做生物科技的人,到目前为止,杀手级应用程序似乎是将其用作非常大的显示器。

加里:  而且它对他们来说效果很好。

贾里德:  看电影。实际上你把它保留为失败者了,Garry,对吧?

加里:  是的。

黛安娜:  它非常适合看电影。也许我认为真正好用并且感觉良好的一个设备实际上是Meta RayBan。它没有任何实际的显示器,但我真的很喜欢它的音频和语音功能。我一直在尝试的一个工作流程实际上是使用Meta RayBan,并将其连接到ChatGPT或Claude的任何语音模式,并与之进行关于某个主题的对话。

哈吉:  哦,我有一个问题。

黛安娜:  我还没试过那个。这是一个有趣的想法。它一直与你同在。对。这是一个很棒的想法。这是我一直在做的一个有趣的事情,只是和自己聊天。也许你走路的时候看起来有点像个疯子,但是了解不同的主题很有趣。

贾里德:  要不要聊聊AI编程?哦,当然。2024年是AI编程真正爆发的一年。没错。我的意思是,现在大多数YC的创始人都在使用Cursor或其他AI IDE。它们在夏天就像爆炸式增长一样。Devon证明了你可以完全自动化大型编程任务。是啊,所有这些都是今年发生的。这太疯狂了。

哈吉:  回放代理(Replay agents)也在持续改进,我听到越来越多关于人们在下班回家的路上构建回放应用的轶事。

贾里德:  是啊,令人印象深刻。Replit 将这项技术普及开来,首次让非技术人员也能使用。这真的太不可思议了。

黛安娜:  还有一个技术门槛更低的工具是Anthropix artifact,你可以在这里快速构建非常简单的应用原型,并与Claude聊天来构建非常简单的首页。然后,你可以作为产品经理快速构建原型并展示给你的工程团队。它就是一个功能齐全的工作版本。

加里:  是啊,这很疯狂,因为它意味着一个人可以做更多的事情。你认为这会改变初创公司实际招聘的方式吗?你已经看到这种情况了吗?

我遇到的一些最近刚从YC获得种子轮融资的创始人,他们并没有像传统的建议那样去做。在过去,你可能会说,让我尝试招更多的人。有一些任务通常我必须找到在竞争对手那里做过这件事的人,处理所有客户成功事宜的人。

我需要找到那个在负责该职能的人手下工作的人。我必须雇佣那个人并提拔他们。他们会带来所有这些知识和人脉。然而,有些人却在做相反的事情:我将让我的软件工程师预先编写更多使用LLM的流程。

你知道,我可能最终还是需要雇佣那个人,但可能是在B轮或C轮之后,而不是现在。

黛安娜:  是的,我想我也看到了这种情况,在YC毕业后的公司中,他们正在寻找更有发展潜力的工程师,并且真正熟悉AI编程栈的设置。我看到一个很聪明的面试技巧是,让他们进行结对编程,观察他们如何使用这些工具。你真的能看出来某人是否真的摆弄过这些工具。这实际上是一个不仅擅长编码,而且还擅长提示并判断AI输出是否正确的工程师。我认为阅读和评估所有这些AI编程代理的输出实际上更加重要。

贾里德:  是的,过去一年关于AI编程代理和编程面试出现了一些有趣的争议,因为AI编程代理基本上打破了公司多年来一直进行的标准编程面试。实际上,Harj,我很好奇你怎么看,因为你经营着一家编程面试公司。

哈吉:  我的意思是,有趣的争论是,你是否应该惩罚或阻止在你的公司面试的人使用Cursor或其中一种工具来轻松通过你的编程面试,或者你是否应该直接接受它,并进行调整,测试他们有多高的生产力。我通常认为这些事情的发展趋势会更倾向于后者;我认为最终将变成,你会根据你的绝对产出来衡量,而且标准会提高。

例如,大约十年前的Stripe在这方面很早就意识到了,他们需要程序员做的很多事情是构建Web应用程序和软件,而不是解决艰深的计算机科学问题。因此,行业从Google风格的面试(包括大量的计算机科学问题和白板编程)转向简单地给面试者一台笔记本电脑,让他们在四个小时内构建一个待办事项应用程序。我认为我们将会看到同样的事情发生,行业会进行调整,你将使用这些工具进行面试,期望在两个小时的面试中完成比今天多得多的任务。

就你关于初创公司需要雇用多少人或如何扩展的观点,Garry,现在看来要看到对此产生显著影响还为时过早。然而,有一件事引起了我的兴趣,我最近看了一个Jeff Bezos的采访,他提到他回到亚马逊研究AI。他还表示,亚马逊有数量惊人内部的基于LLM的应用程序——显然大约有一百个甚至可能是一千个——大概是为了高效运行亚马逊。

亚马逊上一次将其为内部基础设施开发的东西发布到世界时是AWS,这彻底改变了初创公司的构建方式。因此,我很好奇他们是否有一些有趣的应用来在内部运行亚马逊,然后他们会发布这些应用,可能为构建和扩展公司提供新的技术栈。这可能与我们最近几集讨论的一些概念有关,比如十人或一人独角兽。

黛安娜:  他们谈到的一个应用是,他们对一个旧版本的编程语言进行了大规模的迁移。每当你需要升级不同版本的数据库等时,这都是一项繁重的工作。他们为此使用了LLM。这就像更改数十万行代码。本来需要六个月或更长时间的工程项目,几周就完成了。

贾里德:  我的意思是,亚马逊对于使用LLM驱动的代理来处理后台流程来说简直是完美的用例。他们一定有大量的机会可以利用。

黛安娜:  他们还推出了他们的大型基础模型,实际上,该模型也开始在一些基准测试中名列前茅。所以我认为他们正试图通过这场竞赛成为另一个竞争者。

加里:  这很有趣,因为从底层来看,例如,一些仍在亚马逊工作的人,可能刚从大学毕业,他们中的许多人无法使用LLM,或者实际上被禁止在日常工作中使用。因此,你知道,这可能是组织在变得足够大时的缺点之一。你知道,未来已经到来,但即使在同一个组织内,它也没有被均匀地分配。但这对于开源和自托管LLM来说都是好兆头。例如,我的待办事项列表上就有一项是构建我自己的Apple mini堆栈,并在我办公桌上的小型集群上运行Llama。

哈吉:  我买了所有的硬件来构建我自己的机器,但是后来我们有了孩子,所以就没能实现。

加里:  但是在某个时候,我对此感到非常兴奋,你知道,YC已经在旧金山恢复了线下运营一段时间。但是我们又重新举办了真正的现场演示日。所以不再有Zoom演示日,不再有Zoom校友演示日。你知道,我们就在这个办公室里,楼下举办了校友演示日。那真是太棒了。然后我们接管了共济会中心,有一千二百名投资者聚集在一个房间里。我认为这对创始人来说真的很棒,因为创始人的数量只有夏季批次的三分之一左右。而且来到我们投资者招待会的人数是之前的两倍,甚至可能是三倍。

黛安娜:  所以大概是10个投资者对应一家公司。

加里:  所以我觉得他们所有人都玩得很开心。

贾里德:  我几乎都忘了线下演示日的能量有多大了。这是Zoom线上无法复制的。YC的演示日也一直是硅谷事实上的投资者聚会,因为这是所有投资者都会可靠出席的唯一活动。所以他们真的很高兴我们把它带回来了,因为当我们不举办的时候,就没有同等规模的活动了。

黛安娜:  算是硅谷的“返乡日”。

加里:  是的,所以现在一年举办四次,这是全球顶尖的早期投资者回到旧金山,希望在那一周的庆祝活动中,最后参加我们的演示日的唯一机会。所以这真是一场盛大的庆祝。

哈吉:  感觉总的来说,线下活动又回来了。这肯定是2024年的另一个主题。当然,今年我们一直在会面和交谈的后期阶段的初创公司,其中最优先的事项之一就是弄清楚如何让每个人都回到线下,回到办公室。我认为远程办公将永远持续下去的时代肯定已经过去了。 终于结束了,太好了。是的,没错。然后发现,是的,线下又回来了,然后旧金山也回来了。非常感谢你,加里。最近的选举似乎进展顺利。我感觉大家对旧金山普遍抱有乐观态度。

加里:  是的,我们有了一位新市长。我们希望他能做正确的事。而且,你知道,我们在监事会有一个非常薄弱的中间派多数,但我们确实除掉了一些在旧金山制造末日循环的最糟糕的人。所以我很乐观。我们没有得到我们想要的一切,但它正在朝着正确的方向发展。

我认为,就像初创公司一样,就像政治一样,你总是高估你一年能完成的事情,但你总是低估十年会发生的事情。我认为这需要十年,需要二十年。但正如初创公司从每年可能有15家公司能达到年收入1亿美元,到现在任何一年都有1500家公司一样,我希望旧金山也能有类似的转变。

我希望旧金山能够成为世界上最聪明的人的灯塔。这实际上可能是我最希望的事情:我们能够继续建设下去。

所以,我们大家向所有观看的观众致以节日快乐,我们新年再见。

关注公众号后设🌟标,掌握第一手AI新动态

往期精选

  1. 黄仁勋专访:OpenAI在大模型混战中达到“逃逸速度”
  2. 李飞飞与Justin深度解读空间智能:数字世界需要三维表征,才能与现实世界融合
  3. PayPal创始人彼得·蒂尔:人类科技停滞源于原子方面的进展远慢于比特
  4. 谷歌联合创始人布林:巨头们打造的“上帝模型”几乎可以理解一切
  5. 马斯克:AI将使商品和服务的成本趋近于零
  6. Karpathy最新专访:人形机器人、特斯拉、数据墙与合成数据

瓜哥AI新知
紧追AI业界一手观点、访谈、动态,点滴构建AI底层认知
 最新文章