(又是一篇偷懒不排版的文章)主要延续历史的一些讨论和思考,围绕AI+硬件展开,算是个开头吧。
PC的时代与时代的PC(上)— 7000字长文解读PC的发展历史与VR的发展阶段
AI时代的人机交互,Screen or Screenless,苹果与Open AI的分歧
AVP和Meta智能眼镜进展不错,大模型激发消费电子创新周期
对这个领域感兴趣的朋友,欢迎添加微信交流~ 👏
微信号:ZHENGFLYA or kaixintuyuan
1、继续从商业模式角度理解大模型产业链的重点。上一篇文章 从商业模式角度看大模型产业 粗略的判断了大模型环节自身的商业模式困局,需要持续大额研发资本投入,难以形成差异化。应用层创业公司面临现有互联网公司的扩展,需要掌握互补品来形成竞争优势。
2、而且模型需要了解用户的Context(上下文和环境),才能有准确的Prompt输入来得到有价值的输出,并自然的与用户交互。不恰当比喻,类似于我们让AI找个饭店,有Context的AI知道我们想减肥,挑选的结果就与不掌握Context的AI输出结果差异巨大,类似老朋友与陌生人的区别。
3、但是想让AI掌握Context,就需要解决数据隐私的问题,数据和模型留在端侧(或让用户觉得如此),是必须要解决的问题。AI+硬件从数据产权和定价角度看,从互补品(硬件能力)的掌握角度看,相比纯软件应用,都天然有更少的逻辑挑战。
4、这一篇增加对产业链的梳理,我们从更大范围来讨论AI大模型产业链的机会和挑战,大体上是有这些板块。看好的标蓝
芯片:一切故事的开始,核心是Nvidia垄断的GPU,但围绕着GPU算力需求外溢到存储(HBM)、互联技术(硅光、NVLink/NVSwitch/PCIE Switch)、散热(液冷)等
算力集群(训练算力):上千张、上万张GPU组成了算力集群,有些是公有云玩家搭建,有些是中国特色的智算中心搭建。为了运行一个庞大的万卡集群,还会需要专业算力调度/优化平台
基础模型:巨头和超级独角兽的角斗场,在算力集群上训练千亿、万亿参数的基础模型来期待构成垄断,但这里有些玩家选择了开源竞争,导致闭源基础模型和开源基础模型互相竞争(比如搅局的Llama、通义千问,Midjourney和SD)
New PaaS 和 推理算力:这是我自创的两个产业环节,与很多Mapping可能不同的是,我简化了LLM Ops/AI Ops/ MaaS等概念。回到事情本身,对应用开发玩家来说,现在有了基础模型后,他们需要一系列的工具来Finetune、RAG、外挂知识库、搭建workflow、观测稳定性、管理MoE多模型、部署等等,需要一批工具。有时还需要采购一些优质的数据集。同时这些工作也需要消耗算力,他们也需要考虑应用运行时的算力,可以选择云服务,也可以选择自己买一批GPU芯片和机柜。凡是解决如上需求的,我都放在了New PaaS这里
多种多样的应用层
有纯软件的形态:既有成熟软件/应用+AI的,也有“原生”的AI应用(Vertical AI、Horizontal AI、Dev. AI Agent、Gen AI、Personal Agent、情感陪伴等等)
也有结合硬件的形态:比纯软件能力要求更为复合,需要平衡小模型+端侧算力+硬件产品定义+AI应用定义+供应链管理多样化能力,具体形态从“科幻”的具身智能,到“产品定义”状态的智能眼镜、空间计算Vision Pro,再到“落地飞行”的AI+消费电子/玩具和AI+手机
5、红杉资本AI Ascent 2024 活动的主题演讲提到了两组数据,可以帮组我们理解产业发展的阶段
第一组数据是30亿美元 vs 500亿美元,分别是AI应用+AI New PaaS创业公司收入(不含云商收入)和产业链玩家在Nvidia GPU上的投资
第二组数据是170亿美元 vs 37亿美元 vs 12亿美元,分别是2023年基础模型/基础设施的融资金额与两大类应用的融资金额对比
6、当看到上面两个数据时,我不禁想到了两个历史阶段,分别是PC的诞生历史和Web万维网的诞生历史
7、对比1960s的“计算机”与1984年的Macintosh,芯片计算能力、操作系统、人机交互模式等等产品要素是逐步成熟的,让“计算机”这个人类大脑的自行车成型。这些能力的成熟与今天基础模型能力(GPT 3-3.5-4-5)的升级、Agent Workflow的诞生、新人机交互范式的诞生有历史的押韵,汇聚成为新一代的硬件产品
感兴趣的朋友,可以参阅历史文章 PC的时代与时代的PC(上)— 7000字长文解读PC的发展历史与VR的发展阶段
8、另外一个历史阶段是PC互联网革命,实际是万维网革的成熟。也是先经历了国家层的信息高速公路建设计划,才为万维网、网景浏览器的诞生打下基础
这是1990s年代美国的国家工程,信息高速公路的构想。在那个时代,主要服务高校和军事单位的NSFNET分布式通讯系统初步显露威力,蒂姆伯纳斯的万维网项目刚刚形成理念,克林顿当选总统后发布了“国家信息高速公路”计划,正式大干快上的建设互联网基础设施。后续才开启了轰轰烈烈的互联网革命
详细的产业历史,感兴趣的朋友可以参阅历史文章 时代的PC(下)- 将世界“连起来”,增强人类智能
9、历史故事可以参考,但不能生搬硬套。
类似的是大模型产业处于互联网革命的基础设施投入+PC诞生的芯片、系统和交互概念定义的双重阶段(大模型近似于新时代的芯片),底层算力基础设施和顶层软硬件应用的“操作系统”、“人机交互”紧挨着前后脚到了投资期
但不同于PC诞生、万维网革命和移动互联网革命时代,现在TMT领域的巨头都还活跃在市场中,而且被移动互联网爆发增长都教育过,反应很快。除非创业公司找到新生代的流量入口,那么在纯软件应用产品上竞争会很激烈
另一个不同点可能更为根本,AI软件应用不像互联网应用,有属于“产品”自身的规模效用,用户量的爆发带来的是模型调用成本和算力成本的爆发。规模不会带来毛利率的爆发提升,逼近90%的档次,无法给粗放式增长、商业模式模糊留出空间
导致的现象就是AI软件应用Day One就要能收费,避免掉入模型能力竞争的陷阱(模型能力够用就行),避免与大厂在显而易见的应用场景竞争。小而美成为了主流审美,不像移动互联网应用那样大开大合的竞争,动不动就是平台。典型代表Photoroom、Even Up~
10、那么为何看好AI+硬件的创新呢?
(这里不得不提非常喜欢的 New Computer这家公司,两个创始人很有灵性,做的Dot这款产品很期待!)
有新的计算能力:大模型升级解锁的生成能力、逻辑推理、多模态能力
有新的人机交互范式:从“0/1逻辑语言”到符合“人类直觉的符号语言”(语言、肢体动作、面部表情、眼神等)
基于新的人机交互范式,会诞生新的操作系统和软件生态:从GUI + APP Economy 到基于“XUI(不知道是什么UI,可能没UI概念了)”+ Agent Economy
种种技术创新的汇聚,最终可能(只是可能)会诞生新一代的通用计算平台,类似 PC、手机这样地位的硬件平台,而且这个硬件平台与人(每一个消费者)的绑定更为深入
11、AI+硬件的创新从商业模式角度也比较顺畅
从消费者购买决策角度而言,解决了客单价(硬件容易做到数百人民币+)和个人数据产权问题
从利润空间角度而言,可以用端侧的算力+小模型来完成,如需调用云端模型API和算力,还可以用服务费形式来cover
从竞争壁垒角度看,做好一款AI+硬件的产品,需要平衡小模型+端侧算力+硬件产品定义+AI应用定义+供应链管理多样化能力,是现有互联网巨头与硬件巨头之间的交叉点
此外现在因人机交互范式、模型能力、操作系统和Agent Economy都尚未成型,因此有容错空间,可以百花齐放
12、从一些有趣的AI+硬件产品看,有两个角度,一个角度是“明确的功能”,另一个角度是“有趣、情商,或者说仿生系统”
13、Meta的Ray-Ban Gen 2 为功能性代表,今年4月份会接入Meta 多模态AI,实现AI看到我们看到的,听到我们听到的,实时的接入AI作为第二大脑。因为是日常佩戴使用,因此容易积累个人的Context,从而为Personal Agent的切入建立数据基础和入口
这个思路的还有Rewind AI、AI Pin这类产品。Meta 的Ray-ban做的成绩不错,国内可以关注叶木科技
关于Meta Ray Ban 感兴趣可以看这个 AVP和Meta智能眼镜进展不错,大模型激发消费电子创新周期
14、另一个角度可以用Disney Research的产品为代表,就是GTC大会上萌萌的类似Wall*E为代表,类似的产品还有“小狗”形态的Loona,新锐的创业公司Looi和Scrap Metal Robotic
很喜欢迪斯尼这个“口号”,not functional robots,but believable characters,如果再好一些,应该是believable friends
这些产品的设计思路是从陪伴、信任、情感互动的角度出发,其产品设计外形就能传达出背后的产品理念
这个路线的产品看似简单,但其背后是拟人化的人机交互系统和一套端侧可运行的仿生情感系统,与用户建立起情感链接后,有很强的品牌壁垒和个人信息(Context)的储备
这个路线可以低门槛的建立起新一代人机交互范式和操作系统的探索
15、此外还有直接瞄准具身智能领域,切家用通用机器人的玩家,这个领域有待调研后再展开了
16、对这个领域感兴趣的朋友,欢迎添加微信交流~ 👏
微信号:ZHENGFLYA or kaixintuyuan