9月22日,线性资本携手智谱 Z 计划在上海举办了一场闭门讨论会,我们从模型、投资、应用等角度讨论模型未来可能迭代的方向,应用落地的进展和可能的场景等等话题。以下为本次活动的分享内容文字总结,在此特别感谢智谱 Z 计划的伙伴 Yizheng、zR,以及现场圆桌嘉宾王禹效@心光、莫子皓@暖哇、庄明浩@屠龙之术、白则人@线性资本。
图|现场合影
目录 建议结合要点进行针对性阅读。👇
1、通用型 AI 搜索是大厂的游戏,而垂类搜索的价值增量难抵切换成本4、AI + 硬件,将在中国卷出来的软件能力和硬件供应链优势结合通用型 AI 搜索是大厂的游戏,而垂类搜索的价值增量难抵切换成本2024 年谷歌搜索的收入约为 2300 亿美元,对应的 MAU 大约是 38 亿,ARPU 约为 60 美元,对应 4 美元的 CPC 和 6 美元的 CPM。对比 Perplexity,2000 万美元的 ARR 和两千万的 MAU,测算订阅的 ARPU 约为 1 美元。可以看出,广告仍然是变现效率最高的商业模式,远超订阅模型。Perplexity 显然也希望采取广告变现,据说他们希望收取 50 美元的 CPM,这么高的价格意味着他们所对应需要吸引的是有购买意图的高质量的用户群体。● 聚拢/分辨高质量用户的效率和购买转化的效率有多高 —— 分发策略国外的生态是以网页为基础构成的,搜索是所有用户的入口,漏斗够大。用户能通过 google 搜索,在网页端完成整个任务执行(i.e。一次购买),给用户和广告主都实现最大的价值。而国内的生态是以应用为基础的,完成购买需要在小红书、携程、飞猪、中国航空等应用之间来回切换,追踪路径破碎,且给用户传递的价值有限。事实上,搜索广告在国内所占份额不断下滑,在百度 2024Q2 的营收中,百度搜索广告的份额也呈现了下降趋势。比起百度,最有可能实现 AI 搜索的是字节。字节有具备大流量入口的抖音(抖音 8 亿 DAU,百度 2 亿 DAU),同时字节也拥有最多的跨行业应用,能够以豆包作为入口,联通各类应用数据,完成执行。从有最大流量入口、有最多跨不同行业的应用矩阵来看,通用 AI 搜索对于大厂友好更多。而就垂类 AI 搜索而言,要打破垂直应用的切换成本是非常困难的。比如 VS Code 作为一款工具,它的用户粘性远远大于搜索工具的迁移成本。在这种情况下,AI 搜索在垂直领域聚拢高质量用户的效率与传统的垂类应用相比并没有太大的差别。对程序员来说,需要写代码时会选择使用 VS Code,而不是在其他平台上搜索相关信息。因此垂直领域的 AI 搜索其实很可能会成为这些产品中的一部分,而不是独立出来作为一个产品。很多 AI 应用在用户粘性和付费上表现得并不乐观,不同市场的打法和数据有很大不同,同样的陪伴对话能力对于不同用户的价值差异也很大。目前情感陪伴方向主要有三类应用:● 基于小说的提问,更多面向青少年,尤其是 25 岁以下的用户,他们与带有人设和故事感的智能体对话,带来读小说的体验。● 基于游戏的提问,类似九十年代互联网的对话式游戏,用户选择路径进行下一步操作;● 一些擦边类内容。聊天时长较长的用户通常都在聊一些 NSFW(Not Safe For Work)的内容。● 一些功能性的应用。比如情感问题倾诉。AI 算命,用户次日留存率大约在 30%-40%,平均对话轮次大约在 5 到 10 轮。聊得比较久的用户有时会持续两个小时,但这种情况通常出现在他们遇到了特定问题。C.AI 曾提到他们的精准用户每天可以聊天两个小时,上面聊天时长很长的场景主要是语 C 和擦边内容。它的用户主要是 14 到 21 岁的学生,GenZ 的内心需求和精神世界需要这样的场景,但他们的付费意愿较低,这是目前 AI 情感陪伴应用面临的一个主要问题。OC 角色在上面基于小说和内容游戏的场景下都存在,他们是花费较多时间进行长时间对话的用户群体之一,可以花费 2-3 个小时进行对话。Talkie 是这类的场景,人均用户时长在 84.18 分钟/天。有一位嘉宾分享,根据他的客户反馈,应用的次月留存率大约为 10%,且留下来的 10%用户粘性非常高,有些用户每天可能花费 6-7 个小时。我们从上面的数据可以观察到,如果有一个垂直的对话场景确实可以拉高时长;但如果场景过于泛化,大多数用户体验一段时间后就会离开。C.ai 被认为是达到 PMF 的 AI 产品:它的使用时长、留存率和用户规模都比目前大家更为追捧的 perplexity 要好得多。他的收费商业化乏力,是因为团队本身的重心不在这儿。如果认真去研究这个赛道,其他人如果想要赚钱,只要路子野,是有机会。然而随着这类应用的不断出现,google 和应用商店也开始对这类应用进行一定的打击,对于 google 认为的 NSFW 内容不进行展示。反观国内,星野 100 多万 DAU 的“AI-native”应用已经很出圈。但放眼中国的娱乐市场,抖音各种版本加总 8 亿的 DAU,快手 2 亿的 DAU,已经覆盖 10 亿的 DAU,而中国的网民数量约为 12 到 13 亿,抖快占据了 80%的流量。如果这类大流量口不对 AI 应用放行,国内留给其他娱乐类应用的空间已经很少,双边生态起量的机会在一定程度上已经被大厂给封锁。这类产品 80%的能力来源于模型的能力,在国内缺少优秀代码生成模型的情况下,可以使用的工具不多。有观众表示,这类应用开发起来其实很容易,没有太大的壁垒,与 Cursor 并没有太大区别。。在特定领域建立知识库后,系统就能实现自动化生成,整合到 VS Code 中也并不困难。Cursor 之所以火爆,一方面是因为带货效应,另一方面是他们确实在产品上付出了努力。他们的界面设计,如在交互上使用 DIFF 功能来审核信息等。从 Cursor 的数据可以发现,其技术护城河不在于索引本身,更多的是工程和产品体验层面的 know-how。在 Cursor 的社区中,去年已经索引了 13 万个仓库,共有 13 亿次下载,平均每个代码仓库有 1 万次下载。这些数据表明,他们在产品和用户体验上有独到之处,提升了用户的黏性和满意度。2、国内需求不高,真正写代码的程序员都在用国外的应用国内有能力的程序员早已在使用国外的工具(如 Cursor、GitHub Copilot)来提高工作效率,这些工具在国内的普及度已经很高。程序员没有强烈的动机去寻找或使用新的国内替代品,因为现有的工具已经满足了他们的需求。同时,代码生成工具主要解决的是一些基础代码问题,无法处理复杂的算法逻辑。国内用工成本相对较低,与其使用代码生成工具,不如多招几个实习生,成本可能更低。对于企业而言,投资于这些工具的性价比不高。工作内容方面,国外项目上线的核心工作量在于生成代码,而国内却更多在应付微信验证、申请微信支付、工商备案、ICP 备案等琐事,这些占据了 90%的精力,相比之下代码生成节省的时间有限。OpenAI 的切片数据就显示,去年中的某一天,中文用户占比小于日文用户,不到 10%,国内真正使用这类工具的用户并不多。在 2B 端,大厂们包括字节和百度,都是从原有的内部编程辅助工具开始,从内部打开逐步向外发布。这些公司多年前就已经在内部开发了类似的功能,他们的目标客户群也大多集中在金融和国企等行业,这类公司内部的程序员,并不愿意使用采买的 AI 编程工具。与人类语言表达不同,代码生成更加强调逻辑推理能力。如果将 prompt 看作一棵树的根节点,那么生成过程就像是在进行 BFS(广度优先搜索)。而通过 SFT(Supervised Fine-Tuning)方式训练的模型,再结合维基百科等进行搜索,实际上是在树结构中进行 DFS(深度优先搜索)。以 o1 模型为例,它在进行 MCPS(Model-Constrained Perplexity Search)时进行了多种 DFS 检索,并通过价值函数在每次检索时进行优化。由于整个探索空间相对较大,在大模型向推理、数学和代码方向发展的过程中,代码和数学方向的推理结果通常是唯一的,只有一个或几个正确答案。随着逻辑推理能力的增强,大模型在代码生成方面的表现会进一步提高。按照这个趋势发展下去,代码生成的效率将会不断提升,搜索工具已经将程序员的工作效率从 10%提高到 30%,而 Cursor 则可以从 30%进一步提升到 40%。当效率提升到某个临界点时,或许产品经理直接根据需求文档就能生成整个系统的代码,最终完全不再需要人工干预。AI+硬件,将在中国卷出来的软件能力和硬件供应链优势结合AI + 硬件,将在卷出来的软件能力和硬件供应链优势结合,这为初创公司和传统硬件厂商都带来了新的机遇。目前能发现的两个主要趋势是全球化与出海带来的新需求,以及在已经得到验证的场景中通过硬件入口切入:比如用户在使用海外模型时,往往会先把 prompt 翻译成英文,再把输出内容翻译回中文或其他语言,这无形中增加了对翻译服务的需求。由于一些突发事件,中东市场已经开始显示出新的“信创”机会,尤其是在 3C 领域。中东有 5 亿人口,他们对硬件爆炸事件的反应相当激烈,也在某种程度上创造了一个中国出海的新机会。一些企业结合自身在硬件供应链上的优势,以及国内软件产品化的能力,实现了"降维打击":(1)翻译类产品(科大讯飞的翻译耳机):科大讯飞推出的翻译耳机,售价约 1900 元的翻译耳机,销量达到了数十万台,远超预期。(2)会议纪要/对话分析类产品(Plaud):Plaud 今年的收入大约达到 5000 万美元,取得了相当不错的成绩。事实证明,如果专注于一个场景,将软件产品化程度做到极致,再叠加硬件形态,依然可以取得可观的成果。现在,许多产品都找到了长期存在的硬件入口,比如手机壳、工牌等。工牌天然地处于一个使用场景中,且距离用户的嘴巴相对较近。有客户利用 B2B2C 模式,通过工牌进行客户画像分析,帮助企业更好地管理员工。从眼镜、Apple Watch、手机、电脑到耳机,成年人可穿戴设备的形态似乎已经没有多少拓展空间。但这种需求实际上是可以"溢出"的。(1)从成人溢出到不同年龄段和物种。成年人的 Apple Watch,在儿童市场可以是"小天才手表",而在宠物经济蓬勃发展的当下,Apple Watch 可以是宠物项圈,这是把人的需求延伸到了儿童和宠物身上。(2)从个人溢出到场景。具身智能虽然还有较长的路要走,我们可以先把它放到特定场景中去尝试,如儿童机器人、陪伴机器人,或者像 Lovot 这样的产品,将属于个人的消费电子场景化。AI 的发展仍然处于早期阶段,类比互联网发展历程,从 1995 年浏览器出现到 2000 年泡沫破裂,再到移动互联网时代,AI 也将经历类似的长期发展过程。今天的市场与 10 年前的互联网初创阶段有一些相似之处,仍然需要时间和资本来推动整个行业的发展。虽然很多基金开始投资 AI 项目,但真正扎根于 AI 应用的公司并不多,很多还在试验和探索阶段。在过去一年里,除了大模型公司,纯做 AI 应用且拿到较大规模投资(5000 万美金以上)可能也就 20 家。这些公司的平均员工数量是 20-50。尽管资本市场看似平静,但从事 AI 应用创业和探索的人仍然非常活跃。今年有很多创业者采用更高效的组织方式,在快速推进 AI 应用的落地。这些创业者的团队规模较小,可能只有 3-5 人,但执行力非常强。因此机构的投资策略也在适应这样趋势,以更快、更新、更早的方式支持这些创业者。对比一年前,当前 AI 创业面临的很多核心问题仍然存在,如用户增长、留存率、转化率等。现在环境的变化使得 AI 相关企业的发展策略也要调整。曾经的流量特别便宜,如今一方面是融资环境发生了变化,另一方面公司内部资金的流向也在发生转变,很多公司发现与其将资金投入内容生产,不如投入内容运营。通过分析 Y Combinator 过往的项目,可以发现 AI 创业方向已经相对饱和,大多数可以想到的 AI 应用方向已经有人在做。AI 创业这波浪潮中,大家在模型能力、方向选择、项目实施、市场推广上没有的巨大差异,所以大公司在许多共识方向上优势明显,体量很大。AI 硬件领域,除了提到的电脑、手机、耳机、手表、眼镜,还有很多可能性,比如戒指(如 oura)、传感器(如 cgm 血糖监测),身体可以携带很多类似的传感器,但这方面的潜力大大被低估。传感器还可以应用于医疗领域,替代摄像头帮助家属了解护理的真实情况。AI 给中国的 ToB 市场带来新的希望,传统的 SaaS 模式是将内部效率优化的工具卖给其他企业,相当于在培养竞争对手。而有了 AI 大模型的"屠龙刀"后,企业可以更专注于扩大业务规模和投入更有价值的场景中,而不仅是卖工具。o1 的出现展示了 AI 如何在特定领域里已经超越了人类。例如,o1 在北美数学竞赛中能够进入全美 top500,在数学、物理、化学等学科上也已经达到了顶尖水平。这就像 Alpha Go 超越人前后的区别。如何有效利用 AI 工具将会成为一个重要课题,尤其是在 AI 超越人类能力的情况下,我们未来需要着重学习如何将 AI 的智慧转化为人类可用的资源。o1 的强大之处在于能很好地处理需要逻辑链和推理链的复杂问题,并且展现出类似人类智慧的思考过程,尤其在代码生成方面表现出色。因为 o1 在专业性和解决复杂问题的能力显著增强,用户需要提出更高质量的问题才能充分利用其潜力,因此模型的进步对用户的思维和提问能力提出了更高的要求。就使用场景而言,o1 在复杂的多步决策任务中有很大潜力,比如开放世界游戏的剧情编排、销售流程的个性化设计等,通过强化学习等方法,可以让 AI 完成具有明确目标和需要对抗的任务。然而,o1 还不是“终极形态”,它的速度和效率仍然存在很大提升空间,现在需要 30 秒才能回答一个问题。从技术的发展角度来看,它仍然处于一个相对基础的阶段——从“有”到“能用”,再到“好用”的过程才刚刚开始。从投资角度看,2023 年初投资人关注大模型,下半年关注 AI 算力,2024 年初又开始看 AI 应用,短短几个月之后,又有人认为 AI 应用的市场可能已经饱和,但实际上,这才刚刚开始。比如现在普遍认为根据 scaling law 卷参数的回报不够好了,紧接着发现可以在 pre training 和 post training 时使用强化学习,除了文本之外的多模态的大模型也没有充分发展。短期的角度看,OpenAI o1 可能适用的两个潜在应用方向:1)数理化等高等学科的教育场景。可以与现有的 AI 教育平台为大学生提供更高水平的 AI 辅助教育。2)跨学科研究和推理。由于 o1 在强化学习过程中接触了多个学科,增强了跨学科推理能力,可能在材料科学和应用感知等领域带来新机会。OpenAI 的最新融资目标在 50 到 70 亿美金之间,最低投资限额是 2.5 亿美金,已经超出了很多基金的总规模。之所以认为 o1 非常重要,是因为那些掌握巨额资金的金融集团的决策者们如何看待 o1 是决定性的,是视作新时代的开始,还是阶段性的技术进步呢,这种差异决定了资本流向。AI 在 ToB 领域有巨大潜力,且 To B 业务比 to C 简单很多,只需要看能否提升 ROI。对 to B 业务来说,通过把人工处理的事情中非常简单的部分拆解成超级小的 SOP,再通过大模型实现完全自动化,只需要考核大模型处理得是否准确,完成大部分工作即可。所以做 to B 不用像 to C 那样费力猜测用户想要什么,只需要观察 ROI 和盈利能力。SaaS 商业模式在中国仍然可以跑通,核心是看能否帮助企业把 ROI 打正。大模型在 SaaS 领域的应用是非常有效的,因为如今所有的数据都存储在数据库中,如 MySQL 或 MongoDB,开发者只需要从数据库中提取数据,再用大模型处理数据就能大幅提高效率,不需要从头构建基础设施或开发 APP,和 10 年前完全不同。除了大公司,创业公司也有机会利用 AI 提供 ToB 服务。创业公司只要掌握了核心的落地 AI 的能力,比如建立线上数据回流标准平台、prompt 编排和管理平台,结合模型更新和数据样本的管理平台,并且适配迭代 workflow,就能够提供相关 AI 服务。现如今针对于公司采购预算逐渐收紧的情况,做 Tob 业务的 Sass 公司可以尝试新的商业模式,即免费帮公司做私有化部署,并直接参与公司业分红。这种商业模式有望在不同行业实现规模化应用,但需时间验证其长期效果。独立开发者需要具备良好的综合能力,包括审美能力、用户沟通能力、产品落地能力、运营和营销能力等。成功的关键在于认识到自身的不足,并积极寻找方法弥补。当前时代对独立开发者具有巨大的友好性,利用各种技术和 AI 工具来弥补个人能力缺口,可以使更多人有机会成功开发和推广自己的产品。
关于线性资本
线性资本 Linear Capital 是一家聚焦“前沿科技+产业”方向投资的早期投资机构,即以数据智能、数字新基建、新一代机器人技术及传统领域的新技术变革(如生物医疗、材料、能源等)为代表的前沿科技,应用于各个垂直产业大幅提升产业效率,赋能其解决痛点问题,完成产业升级,通过产业价值的大幅度提升实现商业价值的超额回报。目前总共管理十支基金,管理总规模约20亿美元。
我们投资阶段以天使至A轮领投为主,每个项目投资金额从100到1000万美元(或等值人民币)不等。
目前已在早期投资了地平线、酷家乐、神策、特赞、Rokid、观远数据、思灵机器人等超过120个创业团队。线性已投资项目估值合计约200亿美元。
短期内,线性资本正在努力成为最好的「数据智能科技基金 Data Intelligence Technology Fund」,并在长期内逐步打造成最有影响力的「应用性前沿科技基金 Frontier Technology Application Fund」。