大环境下,头部AI大模型发展趋势放缓,应用落地成为关注焦点
前 OpenAI 科学家 Ilya Sutskever 在近期的一则演讲中指出,我们熟悉的 AI 预训练方式将走向终结。
他提出这一观点的主要理由是当前人类可以用做AI预训练的数据正在走向枯竭。
从EPOCH AI的数据给出的结论似乎印证了这样的观点,当前全球模型的平均算力增速大概在4.1倍,远快于数据规模的增速。
Ilya此前作为Scaling Law的忠实信徒,如今他观点的切换显然一石激起千层浪,有赞同者的同时也有不少人工智能大佬站出来反对预训练即将结束的观点。
在这里我们无法对AI前沿方向做确定性的预测,但不可否认的是,当前前沿大模型的能力扩展的速度正在出现显著的放缓,预训练阶段的探索和模型能力提升开始出现方向上的分歧,继续坚持现有 Scaling 技术路径是否是实现AGI开始打上问号。
24年初开始,行业巨头开始转向尝试利用多模态数据、合成数据等方向,但尚未出现极其一致的产业合力。在下半年OpenAI o1大模型的出现后,产业才重新形成以后训练+强化学习方式继续迭代的共识。
近期半导体行业发生了一场突变。博通突破了万亿美元市值,与英伟达近期颓势的股价表现形成强烈对比。这一变化其背后反应的逻辑是定制芯片(ASIC)在当前市场上的需求正在快速放大。
ASIC 之于通用GPU的差别在于针对边缘计算和定制化推理侧的应用而言,ASIC将具备更高的运行效能。换句话说,针对特定的应用场景,ASIC 比英伟达通用加速卡更加省钱也更加高效。
随着谷歌、微软、亚马逊等头部云计算厂商开展合作,Meta、苹果、字节也开始同博通进行洽谈。
ASIC需求的爆发式增长背后一方面反应了巨头开始对CAPEX结构进行优化,一方面则传达出它们开始着手特定的应用场景进行布局的讯息。
那么前沿的大模型厂商当前在做什么呢?
首先是OpenAI,近期连续12天12场发布会看似是技术进展的揭幕,实则是一场注意力管理的营销表演。
o1的完全体和Sora的推出主要是OpenAI对以前发布的“期货产品”进行了一波“交割”,GPT-5当前依旧迟迟没有到来,取而代之的是OpenAI进一步将ChatGPT做的更加“产品化”。例如它们发布了Canvas的画布功能发布、宣布可以通过拨打电话的方式来访问和使用ChatGPT等策略。
至于Anthropic,CEO Amodei 在与《金融时报》的一则采访中提到,2025年公司的业务重点,除了提升大模型本身自我解释方面的能力外,将更加聚焦将Claude推广至医药、生物技术公司。上个月发布的 Computer Use Agent功能当前可能会在to B市场进行应用,Amodei 认为 Computer Use 还需要持续打磨至成熟产品才会推向to C市场。
在 AI 这辆高速列车开始减速后的当下,AI的落地的应用终于得到了充分的关注。
豆包:最大的投入、最多的数据、最强的营销,还只是字节的第一步尝试
当我们将视角从海外转移到国内,当前字节跳动携带着豆包,无可争议地站在了 AI 应用赛道的风口浪尖之上。
当我们仔细梳理字节或者豆包的胜利,其背后的原因已然有迹可循。
首先是公司高层对于AI持续的专注度,字节真金白银投出了全国第一的AI Capex。
张一鸣虽 2021 年卸任 CEO,仍深度参与 AI 战略布局。此前有行业消息传闻,张一鸣在新加坡几乎和人工智能产业界的每位头部科学家都聊了天,对内部重点强调追求通用人工智能目标。
而今年,字节确确实实是这么做了。
我们知道人工智能大模型性能取决于三要素,即算法、算力和数据。
字节跳动今年的Capex投入极高,达到了 800 亿,接近国内 BAT 三家资本开支总和(约 1000 亿)。
最大的CAPEX投入,对应的是顶满了的算力。
字节今年还是英伟达、博通的前大客户之一。23万片 Nvidia 计算卡的采购量仅次于微软,超越Meta、亚马逊和谷歌等传统科技巨头。
有研究机构预估 2025 年字节跳动资本开支将达 1600 亿,900 亿用于 AI 算力采购(国内 400 亿、国外主要东南亚地区 500 亿)构建计算力基础,700 亿用于 IDC 基建与网络设备招标(国内 500 亿、国外 200 亿)打造数据中心集群。上周末那篇广为流传的关于字节AI基建硬件招标的调研纪要,也隐隐透露出公司层面对于扩建算力的无限坚决。
作为一款 chat类产品,豆包的成绩确实与其他同类产品有着巨大的身位领先。
字节跳动火山引擎总裁谭待表示,在过去7个月里,豆包大模型调用次数增长了33倍。
根据AI产品榜应用榜统计,豆包11月全球活跃用户近 6000 万,仅次于 Chat GPT。而排名第二的文小言,11月MAU数据则是1300万左右。第三名的Kimi数据则只落后文小言100万。在APP端DAU排名上,豆包以850万DAU是kimi的接近3倍。
当前Chat类产品同质化极其严重,尤其是具体到 toC 层面的话,豆包无论是在交互或者是用户使用体验上,同腾讯元宝、kimi、文心一言相比,实际上并没有那么大的差别。
而豆包之所以能够在流量上大幅领先于同类产品,最大的差异点在则落在了推广营销的能力上,而这背后则深度依赖字节雄厚的家底,特别是巨量引擎的全力助攻。
众所周知,中文互联网数据自短视频兴起后经历了新的一轮大洗牌,当前没人能否认短视频已经入侵了一切的事实。我们可以认为,抖音作为短视频应用的NO.1,几乎涵盖了全中国各类人群的数据资源。
在数据量方面能够与抖音相媲美的,大概也只有腾讯微信公众号、B 站、小红书以及老对手快手。
仅将微信与抖音做比较(这两者用户数量最多),抖音 6 亿的日活量已经极为接近微信 7 亿的日活量水平。从数据质量来看,微信单个用户所能贡献的数据量较为有限。微信侧重于熟人社交,公域流量集中于公众号与视频号,用户标注行为较为单一,在对用户兴趣的深度挖掘以及精准匹配方面相对薄弱。
而字节则深入挖掘公域数据流量,其推荐算法在技术层面与其他大模型厂商相比也具有显著优势。
抖音单列无限瀑布流的信息输入能够实现接近120分钟的用户使用时长,足够说明在推荐算法层面字节的优势所在。抖音有着诸如浏览历史、点赞、评论、搜索等更为丰富的用户行为分析维度,用户数量越多,所积累的数据量就越大,算法也就越发精准,从而继续拉动用户数据的持续产生,呈现明显的飞轮驱动效应。
字节的推荐系统能够实时根据用户的行为反馈进行调整和优化,快速响应用户的兴趣变化。例如,用户在抖音上浏览了某类视频后,后续会立即收到更多相关视频推荐。而 B 站和微信的推荐系统在实时性方面相对较弱,调整推荐结果的速度较慢。
基于这样的数据基础和技术积累,字节可以仅仅依靠自家平台,做到对单一产品的全量实时推送,并依靠推荐算法实现极高的用户转化率。
最好的防御,就是全面进攻?
各家厂商当前时点面对的最大问题,就是产品需要聚焦到哪个垂类场景。而字节给出的答案,是我全都要。
字节用“大力出奇迹”的方式,开启了AI全链路的“饱和式”攻击,一举怼出了一个全覆盖的 AI 应用帝国。
新皮层公众号近期在一张表里列举了当前字节所有的产品。按照类别划分,字节覆盖了自然语言、语音、多模态、图像、视频层面进行大模型技术的研发;在智能助手、社交情感陪伴、生产力、创意、教育、短视频电商等应用场景中,也做到了全面覆盖。
在硬件方面,我们也能看到诸如ola Friend、显眼包智能玩偶等泛类消费电子产品的项目出现。这反映出字节一直以来都十分擅长的“内部赛马+无限烧钱”的模式,在当前阶段依旧很能打。
12月18日字节跳动火山原动力大会正式召开。一系列新的功能产品的发布,豆包视觉理解模型(对标google Astra)、针对开发者的代码编写工具Marscode、联合英伟达推出3D生产模型及应用平台veOmniverse、升级豆包通用模型pro能力全面对齐GPT-4o。此外还升级了音乐生成模型、文生图模型。
除此之外,火山引擎+豆包大模型的组合继续化身价格屠夫,将每千tokens输入价格定为3厘(即0.003元),几乎达到了全行业最低的价格。
以上种种其实表明了字节的远景并不是只满足于豆包单一产品本身,而是想通过产品矩阵覆盖当前我们能够想象到的所有领域,并最终实现张一鸣AGI的最终目标。
好不好,看疗效,寻找垂类场景是 AI 应用的最佳出路
当今豆包概念的爆火,不由得引人联想起今年3月 Kimi 概念爆火的场景。
Kimi的出现同样来自于技术的创新,更重要的是在营销层面抓住了创始人“90后天才创业者”的设定,以及“200 万字长文本”的概念,实现了火爆出圈,在国内 AI 产品访问量排行榜位列第 3。
切入的长文本赛道原本确实打出了和其他同类产品的差异化。但是不久,随着阿里通义等其他厂商迅速追赶上了长文档处理功能,Kimi概念呈现出高开低走的趋势。
但我们不可否认的是,“长文本”这种更加细分垂类的概念打出的差异化,确实足以激发市场对一款AI产品巨大关注。
回到字节及其产品本身,豆包首先在传统的 MAU、访问量数据上的亮眼表现确实是有目共睹,这一点毋庸置疑。
但如若我们细看同期发布的 AI 产品榜的日均时长排名,似乎能捕捉到一个较为消极的讯号。
11月最新数据,国内APP应用的端侧使用时长,排名第一的是文小言,时长为7.28分钟,MAU 1300万。拥有6000万MAU的豆包,人均日使用时长也仅6.1分钟。
似乎是有更多的用户开始用AI产品了,但是用户并没有每天都用,他们的粘性实际上并不高!
对于大众用户而言,除了在归纳文档、搜索知识等生产力领域要去使用一下之外,我们似乎没有理由去调用一下AI。这完全是可以理解的,但是对于传统互联网app而言,这样的每日时长数据放对于哪家公司而言,显然都是不能令人满意的。
用户并没有形成日常中高强度的使用习惯,那么后续可能引发更深层次问题在于,这样的产品是无法在用户增值和广告营销上去做商业化的,即最终的盈利问题。
在国内,你肯定是无法像 OpenAI 那样收高昂的订阅费的,对吗?
如果我们将视角放到全球,或许情感类聊天似乎说当前确定性更强的方向。
我们发现海外AI应用日均时长排名前10的app中,有9个都是诸如Character AI等AI情感陪伴类软件。活跃度较高的Character AI 11月MAU在2600万,近三月用户日均使用时长为98分钟,整个时长已经几乎接近B站用户的日均时长了。
显然今年谷歌收购 Character AI 这笔生意相当合算,并且相当于是在AI情绪价值消费的赛道上,给其他潜在的竞争对手埋下了一颗很深的钉子。
尾声
在AI圈中一直流传着这么一句话,叫作如果你什么方向都做,那这也代表着你不知道哪个方向才是重点。
对于字节而言,尽管当前依旧有着足够的信仰和雄厚的资金,在如此多的范围内全力投入,但字节一定知道,自己不可能是未来所有赛道的赢家。
当前走出来的豆包,显然只是字节的牛刀小试。明年更需要关注的,是字节在这些新兴垂类赛道上的布局。
硬件方面,近期有消息传出,随着百度与苹果就国行Apple Intelligence合作上的小坎坷,字节和腾讯正在同苹果进行初步的沟通,豆包上 iPhone 未来可期;在软件方面,字节委派前抖音产品负责人张楠全面牵头即梦项目,意图打造一个AI领域内的“新概念抖音”出来……
历经了2024一整年的探索,业界对于产品细分方向的挖掘似乎也才刚刚开始。
当苹果丢掉了自己的传统艺能
Ola Friend 字节硬件产品的再度尝试
当手机用上纯视觉的“自动驾驶”