【浙商计算机】字节的AI军备竞赛——大模型行业点评

文摘   财经   2024-12-27 11:35   北京  

分析师:刘雯蜀/童非/叶光亮

执业证书编号:s1230523020002/S1230524050005/S1230524080010

研究助理:张致远

来源:浙商证券计算机研究团队

具体参见2024年12月25日报告《字节的AI军备竞赛——大模型行业点评》,如需报告全文或数据底稿,请联系团队成员或对口销售。




投资要点


摘要


1、豆包用户规模与市场影响力具备与GPT竞争的实力

字节跳动免费向公众开放性能领先的豆包大模型,我们认为从投入力度以及市场占有的角度,均展现了字节跳动有望引领行业的迹象。截至2024年11月,根据AI产品榜数据,豆包App的月活跃用户数已接近6000万,仅次于 OpenAI 的 ChatGPT,位列全球第二,MAU增速达到16.92%。其海外版 Cici的MAU也达到 1267 万,位列第 22 位。豆包用户粘性较高,3 日留存率达28%。调用量方面,12月18日火山引擎CEO谭待表示,豆包大模型日均tokens使用量超过4万亿,自发布以来七个月增长超过33倍。近3个月来,豆包大模型在信息处理场景调用量增长了39倍、客服与销售场景16倍、硬件助手场景13倍、AI工具场景9倍,拥有梅赛德斯-奔驰、广汽集团、华泰证券、招商银行、浙江大学等合作伙伴。


2、字节研发投入显著领先同行,类比于微软加力投资OpenAI,字节之于中国或可类比OpenAI之于美国

资金上:字节跳动在AI上投入巨大,2024年资本开支达到800亿元,接近百度、阿里、腾讯的总和(约1000亿元)。2025年字节跳动资本开支有望达到1600亿元,旨在打造自主可控的大规模数据中心集群,其中约900亿元将用于AI算力的采购,700亿元用于IDC基建以及网络设备如光模块、交换机。海外大模型蓬勃发展离不开巨大的算力投入,而字节巨量的算力开支有望带动整体中国AI产业的发展。
字节跳动对未来Token消耗估计较高,预计将持续加大算力投入。2024年9月字节跳动火山引擎智能算法负责人吴迪曾表示, 2027年豆包每天Token消耗量预计超过100万亿,是原来的100倍以上人才上:据证券时报,公司创始人张一鸣不仅亲自负责从竞争对手公司招揽AI人才,还多次在内部强调追求"通用人工智能"的目标。大模型成员来自字节的核心部门,语言部分由搜索团队牵头,图像部分由产品研发与工程架构部下属的智能创作团队牵头。


3、豆包大模型家族全新升级,产品对齐GPT-4
2024年12月18日,字节火山引擎冬季FORCE原动力大会召开,豆包大模型家族全新升级。豆包通用模型pro:综合任务处理能力较5月份提升32%,全面对齐GPT-4o,使用价格仅为后者的1/8。豆包视觉理解模型:可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。豆包文生图模型 2.1 版本:支持“一键P图”、“一键海报”,可以高精度指令理解。豆包音乐模型:可生成 3 分钟的完整作品,让音乐创作变得更加轻松自如。豆包3D 生成模型:支持文生3D、图生3D及多模态生成。即梦 AI:通过即梦AI,用户可以轻松生成高质量的图片和视频,为社交媒体平台注入更多新鲜和有趣的内容。除了模型的升级,火山引擎还对火山方舟、扣子和 HiAgent 三款平台产品进行了升级帮助企业构建自身的 AI 能力中心,高效开发 AI 应用。


4、字节天然具备AI基因,多元应用场景可供大模型落地
字节跳动作为由AI算法驱动的公司,下游拥有丰富多元的AI应用场景,可供大模型技术落地。1)推荐算法:大模型作为更强大的AI,有望提升推荐、广告、搜索算法的效果,从而赋能抖音、今日头条等字节核心业务。2)内容创作:AIGC赋能UGCPGC。抖音联合出品的AIGC科幻短剧集《三星堆:未来启示录》在抖音及全平台上线。抖音等平台的创作者还可通过使用豆包“一键P图”、“一键海报”等功能辅助创作。番茄小说植入角色机器人,可模拟小说中的角色与读者进行对话。3)办公应用:飞书上线智能伙伴,实现会议要点提炼,生成文档、表格、导图,数据分析等等功能。



建议关注标的


AI硬件相关:中兴通讯、润欣科技、乐鑫科技、兆易创新、移远通信、恒玄科技、国光电器;
AI算力相关:寒武纪、海光信息、润泽科技、光环新网、光迅股份、高澜股份、英维克、欧陆通、云赛智联、亚康股份、中科曙光、浪潮信息;
AI应用相关:视觉中国、汉得信息、中科创达、海天瑞声。


风险提示


产品研发不及预期、市场需求不及预期、算力供给不及预期、大模型商业落地不及预期。




报告全文


1 豆包用户规模与影响力有望与GPT媲美

字节跳动免费向公众开放性能领先的豆包大模型,我们认为从投入力度以及市场占有的角度,均展现了字节跳动有望引领行业的迹象。截至2024年11月,根据AI产品榜数据,豆包App的月活跃用户数已接近6000万,仅次于 OpenAI 的 ChatGPT,位列全球第二,MAU增速达到16.92%。其海外版 Cici的MAU也达到 1267 万,位列第 22 位。豆包用户粘性较高,3 日留存率达28%。调用量方面,12月18日火山引擎CEO谭待表示,豆包大模型日均tokens使用量超过4万亿,自发布以来七个月增长超过33倍。近3个月来,豆包大模型在信息处理场景调用量增长了39倍、客服与销售场景16倍、硬件助手场景13倍、AI工具场景9倍,拥有梅赛德斯-奔驰、广汽集团、华泰证券、招商银行、浙江大学等合作伙伴。




字节研发投入显著领先同行,类比于微软加力投资OpenAI
AI战略总览:加大流量投放、扩大资本开支、大力扩张团队。


推广策略:字节跳动在推广其AI产品上采取了大力度的广告投放。例如,豆包智能助手在2024年4月至5月的广告投放金额接近1800万元,6月上旬更是飙升至1.24亿元。同时,公司利用抖音等平台的内部流量优势,为AI产品引流。

在许多大模型付费的环境下,豆包大模型在保障性能的前提下免费向公众开放,有助于快速提升用户数量,起到了扩大市占率以及获取庞大训练语料的作用。

资本开支:字节跳动2024年资本开支达到800亿元,接近百度、阿里、腾讯的总和(1000亿元)。2025年字节跳动资本开支有望达到1600亿元,旨在打造自主可控的大规模数据中心集群,其中约900亿元将用于AI算力的采购,700亿元用于IDC基建以及网络设备如光模块、交换机。字节跳动对未来Token消耗估计较高,预计将持续加大算力投入。2024年9月字节跳动火山引擎智能算法负责人吴迪曾表示, 2027年豆包每天Token消耗量预计超过100万亿,是原来的100倍以上。


未来豆包大模型日活跃用户数以及token调用量有望持续增加,算力缺口巨大。我们基于此对豆包大模型带来的算力产业链的GPU/服务器、数据中心设备需求进行了测算。假设2027年日活达到5000万,日均token使用量达到50万亿,为了满足用户需求,在2.5倍峰值token倍数的假设下,2027年算力需求达到1.4E+21 FLOPS,假设未来字节能采购320 TFLOPS的芯片,则需要565.1万个GPU,缺口巨大。


人才投入:公司创始人张一鸣不仅亲自负责从竞争对手公司招揽AI人才,还多次在内部强调追求"通用人工智能"的目标。字节跳动从零一万物引进了算法副总裁黄文灏,以及面壁智能的核心成员秦禹嘉。公司内部实行赛马机制,鼓励团队间的竞争,以提升人才密度和创新能力。

大模型成员来自字节的核心部门,语言部分由搜索团队牵头,图像部分由产品研发与工程架构部下属的智能创作团队牵头。

2024 年 12 月 12 日,字节跳动和北京大学共同宣布成立豆包大模型系统软件联合实验室,双方科研人员将共同围绕大模型的训练、推理开展研究,北大学生还将进入实验室实习,实现理论与实践的结合。


成立Flow和Seed部门,专门攻坚大模型和AI应用。为发展AI战略,字节跳动于2023年成立Seed团队与Flow团队。Flow团队致力于开发基于大模型的AI原生应用,由产品与战略副总裁朱骏和字节跳动技术副总裁洪定坤领导,产品包括豆包、扣子、猫箱等。Seed团队主要负责大模型底层技术的研发,曾担任TikTok产品技术负责人的朱文佳领导,Seed团队的产品包括豆包大模型。


豆包大模型家族全新升级,产品对齐GPT-4

2024年12月18日,字节火山引擎冬季FORCE原动力大会召开,豆包大模型家族全新升级。

豆包通用模型pro:综合任务处理能力较5月份提升32%,全面对齐GPT-4o,使用价格为0.003元。


豆包视觉理解模型:可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。



豆包文生图模型 2.1 版本:支持“一键P图”、“一键海报”,可以高精度指令理解。
豆包音乐模型:可生成 3 分钟的完整作品,让音乐创作变得更加轻松自如。
豆包 3D 生成模型:支持文生3D、图生3D及多模态生成。
即梦 AI:通过即梦AI,用户可以轻松生成高质量的图片和视频,为社交媒体平台注入更多新鲜和有趣的内容。
除了模型的升级,火山引擎还对火山方舟、扣子和 HiAgent 三款平台产品进行了升级,帮助企业构建自身的 AI 能力中心,高效开发 AI 应用。



产品全方位布局,饱和式攻击。字节跳动在AI领域采取“全方位布局”的策略,在产品上采用“头部产品集中力量,新型产品快速迭代”的打法。从生态上看,字节在对话、助手、虚拟社交、图像、视频、智能体、办公、社区、音乐、编程、教育、电商、硬件等几乎全领域都有布局。公司运营约20款AI应用,豆包作为国内用户量最大的原生AI,月活跃用户已达6000万,目标是年底实现1亿月活。


海内外同时布局,核心产品豆包日活全球第2。节的头部AI应用为豆包大家族,包含多个通用及垂类大模型,以及同名AI助手产品。


字节天然具备AI基因,多元应用场景可供大模型落地

字节跳动作为由AI算法驱动的公司,下游拥有丰富多元的AI应用场景,可供大模型技术落地。
1)推荐算法:大模型作为更强大的AI,有望提升推荐、广告、搜索算法的效果,从而赋能抖音、今日头条等字节核心业务。
2)内容创作:AIGC赋能UGC与PGC。抖音联合出品的AIGC科幻短剧集《三星堆:未来启示录》在抖音及全平台上线。抖音等平台的创作者还可通过使用豆包“一键P图”、“一键海报”等功能辅助创作。番茄小说植入角色机器人,可模拟小说中的角色与读者进行对话。


3)办公应用:飞书上线智能伙伴,实现会议要点提炼,生成文档、表格、导图,数据分析等等功能。


5 风险提示

产品研发不及预期:如果豆包大模型或者大模型应用研发不及预期,可能影响字节对算力的需求以及对下游的带动。
市场需求不及预期:如果市场需求不足,则影响对算力需求及AI应用推广。
算力供给不及预期:如果字节无法找到充足的GPU等算力相关部件,则大模型未来难以更大规模、更多活跃用户。
大模型商业落地不及预期:如果大模型未能找到足够多的商业落地场景,则可能影响大模型的盈利并影响产业界对大模型乃至算力的投资。




法律声明及风险提示


本公众号为浙商证券计算机团队设立。本公众号不是浙商证券计算机团队研究报告的发布平台,所载的资料均摘自浙商证券研究所已发布的研究报告或对报告的后续解读,内容仅供浙商证券研究所客户参考使用,其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,使用本公众号内容应当寻求专业投资顾问的指导和解读,浙商证券不因任何订阅本公众号的行为而视其为浙商证券的客户。

 

本公众号所载的资料摘自浙商证券研究所已发布的研究报告的部分内容和观点,或对已经发布报告的后续解读。订阅者如因摘编、缺乏相关解读等原因引起理解上歧义的,应以报告发布当日的完整内容为准。请注意,本资料仅代表报告发布当日的判断,相关的研究观点可根据浙商证券后续发布的研究报告在不发出通知的情形下作出更改,本订阅号不承担更新推送信息或另行通知义务,后续更新信息请以浙商证券正式发布的研究报告为准。

 

本公众号所载的资料、工具、意见、信息及推测仅提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,浙商证券及相关研究团队不就本公众号推送的内容对最终操作建议做出任何担保。任何订阅人不应凭借本公众号推送信息进行具体操作,订阅人应自主作出投资决策并自行承担所有投资风险。在任何情况下,浙商证券及相关研究团队不对任何人因使用本公众号推送信息所引起的任何损失承担任何责任。市场有风险,投资需谨慎。

 

浙商证券及相关内容提供方保留对本公众号所载内容的一切法律权利,未经书面授权,任何人或机构不得以任何方式修改、转载或者复制本公众号推送信息。若征得本公司同意进行引用、转发的,需在允许的范围内使用,并注明出处为“浙商证券研究所”,且不得对内容进行任何有悖原意的引用、删节和修改。


廉洁从业申明:

我司及业务合作方在开展证券业务及相关活动中,应恪守国家法律法规和廉洁自律的规定,遵守相关行业准则,遵守社会公德、商业道德、职业道德和行为规范,公平竞争,合规经营,忠实勤勉,诚实守信,不直接或者间接向他人输送不正当利益或者谋取不正当利益。

计算机蜀你最牛

计算机行业研究公众号,

关注这一个就够了










计算机蜀你最牛
计算机行业研究
 最新文章