中金研究
我们观察到国内互联网公司近期AI发展存在变化,我们认为国内AI互联网应用端存在机会。
Abstract
摘要
AI大模型预训练趋缓,利好龙头追随者。进入2024年下半年以来,大模型预训练环节出现进步放缓迹象,其核心的原因所剩的新的训练数据或已不足。随着训练方法论越来越成熟,算力缺口缩小,人才流动越来越大,龙头追随者凭借强大的财力和资源有望缩小和引领者差距,且整体追赶成本相对可控。
Agent引领AI应用方向,中国互联网公司竞争力强。当下,AI应用方向包括对话机器人,编程助手,办公效率工具,教育,娱乐,赋能传统业务等。展望2025年,AI相关公司将重点应用方向聚焦Agent,例如苹果的Apple Intelligence助手,Alphabet旗下基于Gemini 2.0 Project Astra,Salesforce针对企业用户的AgentForce等。我们认为供给红利是否能够带来需求共振,取决于产品效果是否能够满足用户需求,成本是否可控,商业模式是否可持续等。然而,相比于模型侧更偏追赶状态,对比中美互联网公司,我们认为中国互联网公司在AI应用方向竞争力较强。
风险
AI产品化、商业化不及预期风险;外部环境风险。
Text
正文
大模型预训练趋缓,利好跟随者
大模型预训练出现趋缓迹象
自2010年以来,深度学习凭借更大的数据集(例如ImageNet),更强的算力(GPU),以及更大参数的模型(神经网络)推动AI产业在机器视觉等领域持续取得进展。之后,2017年Transformer算法提出则显著提升了模型算法效率,为OpenAI等引领的大模型浪潮奠定了基础。实际上,从OpenAI GPT系列模型诞生以来,Scaling Law逐步开始成为人工智能行业一种共识,行业参与者均将提高模型参数,更大数据集,更大算力作为提升模型最核心的方法论,其结果确实带来能力和效果更强的大语言模型,以大模型为主的人工智能产业发展迅速。
图表:Open AI GPT系列模型时间线和模型大小
资料来源:Open AI官网,SemiAnalysis,中金公司研究部
预训练是大模型学习通用特征,获取智能能力基础环节。然而,进入2024年下半年以来,大模型预训练环节出现进步放缓迹象,其核心的原因是此前大模型已经学完了足够多的现存数据,而所剩的新的训练数据或已不足。例如,2024年12月在神经信息处理大会NIPS会议上,前OpenAI联合创始人Ilya Sutskever在演讲中提到:“我们传统印象中的预训练机制即将结束,因为我们有且仅有一个互联网。”2024年12月8日,Alphabet CEO Pichai在纽约时报年度会议中也提到:“低垂的果实已经摘完了,我们可能需要进一步突破才能进展到下一步。”此外,外界高度期待的Open AI下一代旗舰模型GPT-5发布延期,根据华尔街日报报道其训练效果不及预期,高企的训练成本,以及不够显著能力提升等都是延期原因。
当然,现有训练数据即将用完并不代表模型已经不再提升,当下仍有几条路线可以提升模型能力。其一是进一步最大化现有数据价值——正如我们第二次看同一本书仍然会有新收获一样,但是重复使用数据价值大概率是边际递减的。其二则是通过强化学习等方式让机器自己生成高质量数据,从而提升模型智能能力。这条路线典型代表包括Deepmind的AlphaGo模型以及OpenAI 2024年5月推出的GPT 4o系列模型。然而,当下加强学习路线仍有局限性,即其仅适用于目标清晰的领域,从而能够清晰构建激励模型,比如围棋,其输赢规则很清晰,类似的领域还有游戏,数学,编程等领域。而针对诸多开放性目标领域,典型比如创意,目前加强学习泛化仍是难题。
利好跟随者缩小差距,甚至后来居上
在商业竞争模型中,创新引领和跟随一直是两种典型的战略,前者往往能够最先尝到甜头,获取先入优势。而如果其能够相对于他人更快进入飞轮模型,则往往能够建立壁垒,成为行业引领者,典型代表例如电商平台亚马逊。然而,跟随战略也有一定优势,例如跟随者往往可以避免创新弯路,以最低成本发展新技术。此外,假若跟随者在资金、资源等维度另有优势,那可能进一步加大跟随战略成功概率。总之,创新引领者必须不断创新,直到进入商业飞轮正循环,否则跟随者始终有胜算。
图表:亚马逊的成长飞轮
资料来源:布拉德·斯通《一网打尽——贝佐斯与亚马逊时代》(2014)
当下大模型竞争或逐渐转向有利于龙头跟随者。如果行业引领者发展速度减缓,作为龙头追随者将获益。在大模型浪潮中,美国OpenAI,Claude等创业公司为行业引领者,他们此前在模型进展被认为引领行业,而Alphabet,Meta,Amazon等龙头则往往被认为是追随者。在中国,月之暗面,Minimax等则被认为是行业引领者,龙头此前被认为是跟随者。而在中美AI发展对比中,美国相关AI公司被认为是模型引领者,而中国相关公司被认为是追随者。随着训练方法论越来越成熟,算力缺口越来越小,人才流动越来越大,龙头追随者凭借强大的财力和资源有望缩小和引领者差距。
一个案例是Alphabet于24年12月抢先发布了下一代大模型Gemini 2.0,并且推出Flash版本供用户使用。相比于前一代Gemini 1.5模型,Gemini 2.0模型具有更强的推理和规划能力,以及更强的编程代码能力,更强多模态能力,以及更强长文本和复杂指令能力,这些使得Gemini在Agent方向能力有显著提升。
另一个案例是在视频生成模型上,相关测评显示中国互联网公司类Sora视频生成模型已经后来者居上,处于行业领先水平。2024年2月,OpenAI演示了文生视频模型Sora,吸引了很高关注度。然而Sora发布后却迟迟没有正式推出,反而中国相关公司更早推出市场化产品。根据AGI-Eval测评数据显示,基于人工测评、模型打分、众包测评三种模式,2024年12月榜单显示,来自国内爱诗科技Pixverse模型,以及快手可灵模型,来自minimax Video模型均得分高于Open AI的Sora。
图表:2024年12月AGI-Eval文生视频模型测评榜单
资料来源:AGI-Eval官网,中金公司研究部
DeepSeekV3展示大模型接下来重要方向之一可能是性能和成本的平衡,此外开源模型蓬勃发展进一步降低了追赶门槛。24年12月,杭州幻方量化推出DeepSeekV3,其模型在英语知识、编程代码、数学、中文能力等多维度均接近甚至超过GPT4o,Claude3.5等领先模型水平。更重要的是,根据相关论文,DeepSeekV3训练成本仅为557.6万美元,而此前GPT-4、Llama3.1等领先模型训练成本行业普遍估计为数千万美元。我们认为DeepSeekV3能够实现如此高的性价比部分原因是其能够“站在巨人肩膀起舞”,减少试错成本。此外,DeepSeekV3代码开源,正如Meta旗下Llama系列模型等开源大模型普及也进一步降低了跟随成本。
创业公司现金流压力增加同样有利于拥有稳定盈利模式的龙头。由于AI目前普遍缺乏成熟的商业模式,且训练成本高昂,因此此前引领创业公司需要持续融资来保持核心竞争力,同时也需要聚焦更多精力来探索商业模式,以求可持续发展,而非全力聚焦提升模型能力。根据CNBC报道,OpenAI 预计24年营收37亿美元,但是亏损高达50亿美元。24年10月,OpenAI宣布融资66亿美元,公司估值达到1570亿美元。此外,24年12月起推出ChatGPT Pro服务,月费200美元/月,用户可以使用最新的GPT 4o系列模型。而此前ChatGPT Plus月费是20美元。国内也有类似趋势,一方面显示AI创业公司财务压力增加,另一方面显示龙头能够此时吸引更多人才回流。
国内互联网龙头模型能力或接近国际领先水平
若以上判断成立,领先者进化速度趋缓,利好追随者,我们认为国内互联网龙头基于资金资源能力,不断招募优秀人才,采购算力,补齐专业认知,其模型能力有望持续接近,甚至不排除局部超过当下国际领先者水平。
积极布局应用,国内互联网公司亦有优势
AI大模型进入应用阶段
一项新的技术出现能够催生无限想象空间,但是其落地的路径却是确定的,首先是产品化,其次是商业化,两者可以统称为应用。过去两年,随着科技龙头持续大幅投入AI资本开支,模型训练成本也水涨船高,而随着大模型能力范围边界圈逐步浮出水面,基于这些能力如何应用化成为市场现阶段关心的焦点。我们大致总结部分当下市场主流的AI应用方向如下:
对话机器人:基于Prompt提示词和大模型互动方式是最直接的人机互动方式,也成为最直接的产品形态。ChatGPT凭借GPT系列大模型引领性,以及AI消费者习惯先入优势获得迅速用户增长。根据Data ai,其2024年11月全球MAU已经达到2.8亿。此外,国内相关产品用户增长最迅速则是豆包,根据QM,其2024年11月国内MAU已经达到5,652万。对于大部分普通用户,这类产品使用场景和传统搜索引擎存在一定重合,特别是信息性信息获取场景,也引起了市场对于传统搜索引擎市场地位担心。不过目前来看Google搜索市场份额仍旧维持90%以上,一方面AI对话机器人模式目前整体用户渗透率仍然偏低,且存在商业模式不清晰,成本较高,幻觉等问题;另一方面,Google推出AI overview产品,已经将大模型对话融入传统搜索引擎,在复杂场景时候会引出大模型(大部分简单问题则不需要大模型就能满足用户需求),从而实现效果和成本平衡。长期来看,对话机器人场景有望演变为Agent的流量入口。
图表:国内大模型App MAU
资料来源:QuestMobile,中金公司研究部
图表:海外大模型/搜索引擎App MAU
资料来源:Data ai,中金公司研究部
编程助手:编程一方面需求刚性,任何涉及IT的企业大概率都有编程代码需求;另一方面也契合大模型长项,尤其是GPT 4o等推理模型结合强化学习训练后,模型在编程领域能力有显著提升。24年10月,Alphabet CEO Pichai曾提到Google内部25%的新代码都由AI工具生成。24年7月2Q24业绩电话会议上,微软CEO Nadella提到Github的年化营收超过20亿美元,其中40%左右由编程Copilot贡献。当下,几乎所有主流大厂都标配AI代码生成工具,同样类似创业公司也被风险投资积极关注。24年4月AI Coding创业公司Devin 以20亿美元估值融资1.75亿美元。24年年底,Cursor以26亿美元估值完成了1亿美元融资,四个月估值涨了6.5倍。根据Polaris研究预测,2024年AI编程工具市场规模为39.7亿美元,到2032年有望增长至271.7亿美元,复合增速23.8%。整体来看,目前AI大模型能力仍处于迭代阶段,而顶尖模型仍有较高成本,当下聚焦核心需求,适当舍弃一些不必要功能,打造商业可行产品反而可能率先跑出。
办公效率工具:实践证明大模型在总结上下文,起草格式化文件等方面有不错能力,此外更新模型在负责任务和规划方面也展现了一些能力突破,这些能力在普通办公场景均有产品化落地的空间。23年11月,微软推出Office Copilot,集合了Word文档生成,PPT生成,Excel数据分析等一系列办公效率AI工具。国内例如WPS AI,其提供了Office Copilot类似功能。Kimi Chat在长文本总结等方面展现一定强项。腾讯会议则推出AI小助手,能够提供实时会议记录,智能摘要等提高会议效率功能。
教育:AI大模型教育产品能够为学生提供个性化的教育计划,能够促进学生更加积极提问(减少社交压力),能够实时评估学习效果提供反馈等,这些优势在教育领域都有望带来产品机遇。以Khan Academy的Khanmigo为例,其基于GPT系列大模型开发,其基于Khan Academy积累教育内容库,并且针对学生问题不直接给答案,而是耐心提供解题思路,引导学生一步步自己找到思路。在Common Sense Media对小孩是否友好的测评中,Khanmigo被评为四颗星,高于ChatGPT和Bard。专注于语言教育的Duolingo也推出了基于大模型的AI助手Lily,仿真对话场景,提供更加个性化、互动化的体验。
娱乐:当下大模型应用在严肃场景仍有幻觉等问题难以根治,但是应用在非严肃娱乐场景还是存在不少应用场景。以早期的Character AI为代表的AI聊天伴侣类应用是目前C端用户体量最大的应用赛道之一,根据Data.ai截至24年12月Character AI月活跃用户规模约为5400万。而来自中国Minimax出海应用Talkie全球MAU也达到2800万,且保持较快增长态势。此外,AI玩具赛道也呈现出迅速增长势头,国内FoloToy跳舞仙人掌基于大模型打造适合儿童互动的玩具。24年11月根据多知网报道,其CEO王乐表示其产品出货量已经近2万台,公司也处于盈利状态。
赋能传统业务,对内降本增效。基于AI能力对传统业务赋能,以及对内降本增效也是当下重要AI应用方向。以广告为例,利用生成式AI更高效、低成本生成营销物料,帮助广告主提升ROI。以Meta为例,其3Q24业绩会表示AI驱动24年以来用户在Facebook和Instagram上时长分别增长8%和6%。在广告侧整合AI能力的Advantage +提供了更全面自动化解决方案,降低广告主投放门槛,提升了ROI。Meta CEO 扎克伯格在25年播客采访中提到AI有望在25年替代中等水平的编程工程师,体现AI有望展现内部降本的效果。腾讯也在3Q24业绩会上提到营销服务借助混元大模型来提升内容和广告物料标签、分类,从而提升广告分发精准度。快手也在24年9月投资者日提到推荐大模型每天给快手带来10亿分钟以上的APP时长增加。同时提到新代码20%左右由AI生成。
Agent或将成为25年龙头争相布局的应用方向
Agent是大模型应用重要落地方向。我们曾在此前《AI时代的分叉点:AI Agent或开启AI原生应用时代》中分析过,大语言模型展现了一定逻辑推理和理解能力,其底层原理和人类大脑神经网络结构具备相似性,因此Agent或可能是大语言模型重要应用方向。实际上,24年大模型演进方向进一步增强了其在Agent应用领域的潜力,一方面多模态功能增强能够和当下手机等硬件更好协同,更低门槛输入现实世界中问题;另一方面,模型推理功能增强也进一步增加了模型处理复杂问题,规划等能力,文本窗口增强也增加了模型记忆能力等。总之,大模型演进方向进一步验证了我们此前对于Agent应用方向判断。
AI agent应用想象空间足够大。我们认为AI Agent不同于诸多对于现有场景提效,有望开始AI原生应用时代,正如搜索场景之于PC互联网,以及打车、支付之于移动互联网。AI Agent正如给每位用户都配置一位“秘书”,能够进一步提效用户生活、工作等场景,其能够渗透进入用户方方面面,因此具有很高用户粘性,以及商业潜力。根据GrandView研究显示,24年AI Agent市场空间为54亿美元,预计到2030年增长至503亿美元,复合增速45%。
龙头争相布局AI Agent产品,25年有望迎来供给侧红利。巨额前期投入+技术爆发周期+潜在大空间驱动龙头集中布局AI Agent方向,且相关产品有望在25年集中落地,其中典型代表有,ToB方向,Salesforce于24年9月推出了Agentforce产品,打造基于原有CRM平台的AI agent助手,能够解决比如高效客服,智能线索分析,优化营销策略等决策功能。24年12月,其CEO Mark Benioff宣布将招募2000名销售来推广Agent相关产品。ToC方向,苹果基于iOS 18.1推出Apple Intelligence助手,其能够为用户提供更智能的语音助手功能,且提供包括信息总结摘要,图像智能AI编辑,文本智能生成等一系列功能。由于苹果iPhone具有庞大用户基础,以及完整的操作系统掌控力,市场普遍认为其最有可能打通应用之间壁垒,为用户提供更好的Agent体验。24年12月,Alphabet发布基于Gemini 2.0模型Project Astra,提供更好的对话体验,更新的工具(Google地图等),更强的记忆能力(10分钟),以及更快的响应速度。此外,其同时推出Project Mariner,能够基于Gemini多模态功能,实时识别屏幕操作,从而帮助用户完成复杂操作,比如指导用户玩游戏。24年12月,国内智谱清言也推出AutoGLM相关Agent产品,其能够自动执行跨应用复杂操作,并具备自主决策能力。
图表:Apple Intelligence相关功能展示
资料来源:Brandon Butch,中金公司研究部
图表:Google Project Astra实时界面
资料来源:Verge,中金公司研究部
► 探索期:效果低于阈值,成本高于阈值。这个阶段更多是在探索各种产品可能性,相关产品一般价格高昂,而功能不佳。典型代表如智能手机探索时期苹果1993年推出的掌上电脑Newton,售价高达900美元,但由于文字输入效果不佳等问题销量低于预期。
► 过渡式创新:效果高于阈值,成本高于阈值。这个阶段核心是通过聚焦产品功能,对非核心功能做减法来平衡成本,少就是多,打造出符合特定用户群体的产品,构建可持续商业模式。典型代表如智能手机时代的黑莓手机,其聚焦email功能,主打可靠性和安全性,省去其他网页浏览等功能,获得了企业用户青睐。
► 全能式创新:效果高于阈值,成本低于阈值。这个阶段核心是打造尽可能贴合用户需求产品,成本考虑不再是核心,这时候往往可以进行融合式创新。典型代表则是苹果的iPhone,其集合了电话,互联网,iPod多种功能于一身,真正定义了智能手机时代。由于能实现功能不是一个维度,全能式创新往往能够对过渡式创新实现降维打击,比如iPhone和黑莓手机竞争,是iOS整体应用生态和黑莓单个产品的竞争。
基于此理论,我们大致认为AI技术普及目前可能处于从探索期到过渡式创新跨越阶段,一方面大模型突破使得AI能力有突破效果阈值迹象,另一方面高昂的算力等成本投入,仍然是阻止技术扩散的原因之一。从这点来看,聚焦某些特定用户需求,奉行少就是多的理念,可能是下一阶段爆款应用的方向。当然,我们认为,长期来看,全能式创新依然意味着更大的机会,只是当下时机可能尚未成熟。
图表:AI应用创新需要突破两个阈值
资料来源:中金公司研究部
我们认为国内互联网公司在ToC应用侧拥有较强竞争力
当前市场上有一种声音声称:“因为美国是AI技术引领者,所以AI应用也必然先在美国普及,中国也是跟随者”。我们认为这种判断很可能是错误线性外推思维导致,模型侧领先优势目前正在缩小,而应用侧中国互联网公司拥有足够的竞争力。实际上,移动互联网以来,基于工程师红利,需求侧国内超大单一市场规模背后是丰厚的数据资源,以及基础设施等优势,国内互联网应用生态在短视频、电商、本地生活,甚至包括手游等赛道在线上化渗透率、变现规模等相对于美国市场都处于领先位置。以电商为例,24Q3根据国家统计局数据线上渗透率为26.5%,而根据eMarketer数据,其预计24年美国电商零售额占整体零售额比例为16.2%。此外,中国互联网公司在海外市场和Meta,Alphabet等海外互联网龙头展开积极竞争,获得了可圈可点成绩。以24年苹果公布iOS App Store年度下载榜单为例,有3款进入美国区域前10 的应用来自中国厂商,分别是字节跳动旗下的Tiktok,Capcut,以及拼多多旗下的Temu。基于以上论述,我们认为AI应用尤其是在C端尝试中,国内公司从执行力,工程师能力,市场基础等多维度都拥有较强竞争力,甚至有望抢先探索出更大空间AI应用方向。
图表:苹果iOS 2024年美国区用户下载TOP10
注:数据截至2024年12月31日
资料来源:App Store,中金公司研究部
模型积极追赶,应用同期探索
综合以上比较,我们认为随着AI大模型预训练机制发展放缓,训练方法论逐步成熟,算力稀缺问题逐步缓解,可选开源模型越来越多,人才流动越来越快等一系列因素,国内互联网龙头作为追随者有望持续缩小和引领者模型能力差距。此外,随着AI进入应用探索阶段,过去十年国内互联网公司积累的工程师能力,执行能力方法论等都有望在C端市场持续探索AI应用潜力,竞争力不输海外互联网龙头公司。
图表:国内互联网大厂AI进展
资料来源:TechWeb,新浪财经,中国经济网,经济参考报,新闻晨报,IT之家,CSDN,新华网,中金公司研究部
风险因素
► AI产品化、商业化不及预期风险:新技术应用场景探索很难提前预测,存在不及预期可能性。当下AI商业模式依然不清晰,存在亏损等不及预期风险。
► 外部环境风险:美国对中国先进芯片禁运禁令等可能延缓国内AI产业发展。
Source
文章来源
本文摘自:2025年1月21日已经发布的《国内互联网AI布局:开启追赶模式》
肖俨衍 分析员 SAC 执证编号:S0080521010001 SFC CE Ref:BIL686
白洋 分析员 SAC 执证编号:S0080520110002 SFC CE Ref:BGN055
高樱洛 分析员 SAC 执证编号:S0080524010008
王秋婷 分析员 SAC 执证编号:S0080523030001 SFC CE Ref:BTK905
魏萌 分析员 SAC 执证编号:S0080524070011 SFC CE Ref:BVB685
Legal Disclaimer
法律声明