Atom Capital：YC Demo Day大盘点—硅谷AI最新创业趋势全解析

文摘 2024-04-10 18:39 北京

写在前面

4月4日，Y Combinator W2024 Batch Demo Day正式开始。这次共亮相260个项目，YC从2.7万份申请中筛选出来，通过率低于1%，是有史以来竞争最激烈的Batch之一。其中超过60%是AI相关。YC身处科技最前沿的硅谷，与这一轮AI技术革命的核心生态有着深厚联系，以创业孵化器模式聚集了大量早期项目和优秀创业者，项目覆盖的广度和前沿性首屈一指。它的筛选聚焦应用价值和创业团队的质量，与Atom Capital的投资逻辑非常契合。这期入选项目中我们看到了AI很多落地场景和有想象力的应用；与去年相比，能明显感到AI落地在加速，越来越多创业者在尝试解锁AI全新的“打开方式”。虽然这些项目本身未来不一定会成为伟大的公司，但它们为探索AI创业机会带来了很多启发。我们总结了本期YC入选项目的最新趋势和让人眼前一亮的项目，与大家分享。

01 YC 是个高效筛选器和未来方向的指引

Y Combinator是硅谷最著名的创业加速器之一，为创业者提供资金、指导和资源，帮助初创公司从概念阶段发展成为具有全球影响力的企业。每年会有两个批次的加速器计划，吸引来自世界各地的创业团队。自成立以来，YC已经孵化了众多知名的科技公司，包括Airbnb、Dropbox、Reddit和Stripe等。身处于这轮AI技术浪潮的中心，从去年起AI就已成为YC主流，入选项目也基本代表了硅谷AI创业的最新趋势。

本届W2024 Batch共有260个项目入选，从2.7万份申请中筛选出来，通过率低于1%，据称是史上通过率最低的之一。项目水准很高，看到了 AI 很多落地场景和有想象力的应用。大量精英创业者涌现，团队大部分只有 2-3 个人，不少产品demo 有创意。这些项目本身不一定会成为未来的伟大公司，但这些创意充分揭示了创业者对业务场景的洞悉，很有启发。

02 从入选项目看AI应用发展的最新趋势

本届YC共166个AI项目，占比超过60%。对比上届，YC S2023 共105个AI项目，占比57%。本届不仅在AI项目数量和占比有进一步提升，而且应用层项目和落地的垂直领域也有大幅增加。很明显，AI的应用落地正在加速。从这些项目中，我们看到几个AI应用发展的新趋势：

AI Agent

AI Agent开始从Task走向Job。AI Worker的概念产品已经出现，虽然还有很大挑战，但已经摆脱简单工具的束缚，走向可以独立工作的 Autonomous Agent。
领域知识库的构建，从简单的RAG技术走向知识的学习和使用。知识的核心表达也从 embedding变成自然语言，而向量数据库最终将只是一个检索加速的技术。

垂直领域

陪伴聊天类应用逐渐走向专业心理和情感健康领域，从利用人性弱点获取流量变成真正对人类心灵健康有帮助。
Dev Agent开始尝试从一次性代码生成走向真实的软件工程项目，但依然面临很大挑战。这期项目出现了软件开发较为前沿的一些创意，比如把 Figma 上 UI 设计直接变成代码、chat to repo 代码集层面的语义理解、支持以文档（而非代码）为中心的 AI 开发模式。
出现针对政府监管/审批流程的应用。这个场景非常适合AI Agent，对中国市场也很有借鉴意义。
Healthcare领域AI应用有爆发的趋势。一些高价值场景被聚焦，技术对医疗产业的巨大变革已经在路上。但由于中美医疗行业的体系、商业模式差异明显，很多创业思路未必适合国内。

多模态

语音技术已经成熟，可能比图像和视频模态更快地进入实际应用。
图像/视频生成已经从模型技术走向剧本故事和情景的描述，回归视频应用的本质。利用多模态的优势，游戏、影视和教育领域将会有很多改变。

AI安全与评估

LLM及Agent评测将成为一个巨大的潜在市场。

这届YC让我们看到创业者对AI技术的理解和应用日趋成熟，应用场景大量涌现，可以预见，未来一两年将有更多的场景爆发，人们期盼的AI应用百花齐放的时代可能会到来。

03 值得关注的新方向和项目

以下的项目让我们研究时眼前一亮，其中不少有意思的创意，也代表最新的AI应用发展趋势。YC官网有本次所有入围项目的详细资料（https://www.ycombinator.com/launches?batch=W2024&tag=Artificial+Intelligence&sort=date）。

AI Agent

从AI Assistant到AI Worker

这期看到的AI Worker项目最主要的特点是：主动行动。从诊所前台主动给患者打电话，到医生助理主动进行患者治疗期间的行为监控；从招聘助理主动搜索简历和完成第一次 phone screening 面试，到 Sales主动给潜在客户致电。Agent的行为范围从被动地完成某个任务，逐步扩展到主动完成一个完整的角色场景闭环，这种从 Task 到 Job 的扩展是 Agent 从 AI Assistant 到 AI Worker 发展的关键一步。迈出这一步之后，Agent 将不受限于亦步亦趋地遵循人类的硬编码指令和工作流（SOP），走进一个更广阔的新世界。当然，获得自由的Agent还在等待更有效的memory 机制、interactive learning和来自LLM更强的推理能力支持。但无论这些技术发展快与慢，我们都将看到越来越多的AI Worker进入日常的工作和生活。

数字员工Agent

HR招聘：Parasale - AI Recruiter: Find and Engage Candidates on Autopilot （https://parasale.io）
销售Agent：Ava, The Sales Rep Artisan - The AI Employee Who Automates Cold Email（https://artisan.co/）

领域知识库的构建，从简单的RAG技术走向知识的学习和使用

LLM的神奇之处在于通过 pre-train 过程成功地编码了海量常识知识，并且能通过自然语言交互自如地应用这些知识。然而无论这些通用知识多么完善，都无法覆盖应用领域特定的知识。因此，Agent 如何构建自己的领域知识库、如何有效地使用这些知识、以及如何通过交互学习和积累知识，始终是 Agent的根本问题，也是最前沿的研究课题。这期 YC有一些非常有意思的项目在探索Agent的知识发现、构建和学习的实践。领域知识库的构建和交互，从简单的 RAG 技术走向知识的学习和使用。知识的核心表达也从 embedding变成自然语言，而向量数据库最终将只是一个检索加速的技术。

知识构建与学习

电商：Lumona - Skincare product search with Reddit and YouTube reviews（https://www.lumona.ai）
多模态文本理解：Reducto - Unlocking data behind complex documents（https://reducto.ai）
研究助手：Lumina - help researchers build a knowledge base in minutes（https://lumina-chat.com）
数据处理：Trellis - Make your unstructured data SQL ready（https://runtrellis.com/）
企业搜索：Danswer - Open Source Unified Search（https://www.danswer.ai/）

有趣的垂直应用

Chatbot—从陪伴聊天到心理健康

经过Sam Altman多次警告和OpenAI应用平台淹没套壳应用的两次重大发布，去年初各种套壳大模型的聊天项目逐渐淡去，创业项目的重点逐渐从通用的陪伴走向针对心理健康/情感的关注。这期关注到的几个项目包括：心理健康治疗、伴侣关系改进、以及患者行为模式的健康监测。这些项目重点关注场景的专业性，Agent主动发起交互，从被动的陪伴聊天到主动地有针对性聊天，从利用人性弱点获取流量变成真正帮助人类的心灵健康。

心理健康Agent

Sonia - AI mental health therapy（https://soniahealth.com）
Maia - Transforming relationships using AI（https://www.ourmaia.com/）
Attunement - Patient monitoring and treatment recommendation for better behavioral health（http://attunement.ai）

Dev Agent开始走向真实的软件工程项目，但依然面临很大挑战

这轮LLM从代码语料中获得推理能力的突破，而代码也是 AI 最核心的能力，正如过程记忆（Procedural Memory）是人类所有技能的归宿一样，学习任何技能和任务最终只有沉淀成过程记忆才可能获得高确定性、低成本和高度并行的能力。同样对于Agent，任何任务学习最终只有变成代码才能高效可靠地运行。

虽然不断有明星项目声称自己开发了AI Programmer或Dev Agent，引起市场和大众的追捧，但至今为止还没有哪个项目达到预期。能承担的任务是在变多，但都还没有解决大规模现有代码集的增量开发，哪怕是不影响软件行为的refactoring或bug fixing 的一般任务都远没有做到，足见这个目标的现实难度。也许，需要 LLM 的推理能力再上一个台阶才有可能突破。这期YC的项目应该反应了当下AI应用于软件开发领域较为前沿的一些创意，比如：把Figma上UI 设计直接变成代码并支持更新，chat to repo的代码集层面的语义理解，以及支持以文档（而非代码）为中心的AI开发模式。

软件开发Agent

Agentic Labs - AI system design tools for dev teams（https://agenticlabs.com）
ion design - Instantly turn Figma designs into clean React code（https://www.ion.design/）
Greptile - AI expert that understands large codebases（https://www.greptile.com）

AI在政府监管及审批场景的应用

这期项目中看到多个应对政府监管或审批流程的项目，例如：申请国家科学基金、通过 FDA 认证、发现和参与政府采购招标项目等等。这其实是一个非常适合AI Agent的场景——在应对严格的规范和过程时，需要非常仔细地研究每一步骤的规范文档，提供和填报高度相关的信息。针对这些精细的自然语言任务，AI 显然比人类更有优势，而且目前 AI 已经具备了很强的文本理解能力，能够从众多素材中有效地抽取规范要求的内容，加以总结和整理，统一提报。AI在这个特别领域的应用价值非常显著，缺点是使用频次较低，市场天花板可能不高。

政府流程与监管

政府监管流程：Artos - Turning science into regulatory submissions（https://www.artosai.com/）
政府采购流程：Hazel - AI-driven marketplace for government contracts（https://hazeltech.ai/）
政府拨款流程：Aidy - We help businesses and nonprofits apply for grants（https://www.aidygrants.com/）

Healthcare 领域开始出现大批落地场景

由于美国医疗行业的商业价值太大（占GDP17%），这一轮LLM在自然语言交流和理解方面的突破解决了医疗保健行业智能化最大的障碍，像诊所预约、患者回访、手术前沟通以及患者的追踪等，语音界面的Agent已呈现出非常好的可用性。这一切不仅显著降低了医疗成本，提升了质量，而且扩大了医疗的服务范围，对患者的健康改善提供了更广泛的支持。Agent 和电子健康档案系统的集成，也为下一步 AI 参与更多的诊断和治疗任务打下了基础，整个 AI 医生融入现有医疗体系的基本条件已经具备。不过，中美医疗行业的体系、商业模式差异明显，很多创业思路未必适合国内。

医疗

Somn - AI receptionists for healthcare clinics（https://somnapp.com）
Arini - The AI receptionist for dentists（https://www.arini.ai）
Anaphero - Automating patient-facing tasks with voice AI（https://www.anaphero.com/）
Hona - Less time with charts. More connected patients.（https://www.hona.ai）
Attunement - Patient monitoring and treatment recommendation for better behavioral health（http://attunement.ai）

多模态：视频生成领域创业更多关注剧本

Sora的发布给AIGC领域带来了一场地震，而这场地震也让大家重新思考视频应用的本质。或许视频模型应该提供精细的渲染技术和强大的物理引擎，而场景情节和画面中到底该有什么人和物、角色的性格和表演以及故事主题线索的演进，所有这些才是视频更核心的东西。毕竟在观众眼中，自然的纹理和物理世界的定律都是高度确定的，没有不行，一旦有了就不再是关注的重点。真正的故事、角色和体验才是人们真正想要的。这期YC创业者更多回归到视频生成应用这个更核心的方向上。

谈到故事情节和剧本，真正最能发挥创作想象力的就是游戏——不仅有文学的创作空间，还有声音和影像的体验，最重要是能通过互动，一边创作剧本，一边扮演角色，也就是所谓的互动叙事（Interactive Narrative）。另一方面，由于游戏场景受控，对视频技术的要求比真实物理世界和电影拍摄的要求都低很多，也是多模态AI技术的最佳试验场之一。

视频生成与游戏

视频：Eggnog - YouTube for AI-generated content（https://www.eggnog.ai）
游戏：Arcane - AI powered Roblox（https://arcanelabs.ai）
视频: Focal - AI movie studio（https://focalml.com）
视频: sync labs- an api for realtime lipsync（https://synclabs.so）

LLM及Agent评测将成为一个巨大的潜在市场

无论现代软件工程规范如何告诫Test Driven Development 是高质量发展的基础，现实中很少有从开发测试用例开始做项目。背后的原因，一方面在于人们开始的时候很难完全想好自己最终要做的产品是什么样的（越是野心勃勃的产品，越是有这个问题），另一方面很多人都预期开始写的大部分代码将被丢弃。

而现在的AI也处于这个阶段，基本上整个产业还处于“裸奔”状态，尤其是Agent的评测，基本上是空白，已有的大部分benchmark都是用来证明Agent如何成功的，很难揭示出Agent多样性的失败模式。这期YC中有一个很值得关注的项目，其主要亮点就在于构建一个Agent，专门用于评测其它的Agent。这个想法虽然很平常，但真做起来会是非常有想象力的一个方向，尤其是如何避免这个评测的Agent 自身成为一个邪恶的破坏者，也是业界一个很有挑战的问题。同一个方向上，另外一个项目是识别 AI 生成的图像和视频。这个想法虽不新颖，但确实是市场的刚需。

评估及安全

Agent评估：MAIHEM - Automate quality assurance for your LLM application（https://www.maihem.ai）
AI生成内容检测：Nuanced - Detect AI-generated images（https://www.nuanced.dev）

04 AI Native时代的团队特色

我们注意到，这届YC有很多顶流学校毕业的年轻人，其中大多数在毕业后3-5年开始创业。虽然年轻，他们的项目却显示出了对技术和场景不俗的洞察力。很多公司成立时间很短，项目demo的完成度却很高，基本上都能有端到端的场景贯通，并能彰显出项目价值。也许，这是新一轮技术革命到来的一个显著特征——面对新技术，很大程度上大家都在同一起跑线上，这时年轻人自然有很大的优势。此次入选的项目创始团队大都很紧凑，都是2-4个人已经走了很远，且联创者之间有长时间的共事经历和友谊。

另外，我们也发现了这期项目筛选背后的“精英主义”：创业者年轻、教育背景（Harvard、MIT、Stanford、CMU、Berkeley等）和工作经历（Google、Meta、微软等）好，项目的定位和创意的想象力也出色。也许现阶段，在这些业界顶流的大学和大厂，人们有更多机会接触 AI 技术，对应用场景的洞察视野也更加开阔，周围的精英也更能激发创业者的想象力。YC的这个选择倾向，在AI的时代，不知是原因还是结果。

About Atom Capital

Atom Capital是一支由连续创业者和投资人成立的新锐风险投资基金，专注于AI、大数据和云原生领域的早期投资，聚焦颠覆式创新机遇，发掘、孵化和陪伴优秀的科技创业者成长。

Atom Capital

科技最前沿，创业路上的一点光