核心观点
1、字节发布豆包实时语音大模型发布,AI版图持续扩张
2025年1月20日,字节跳动发布豆包实时语音大模型,该模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。相比传统级联模式,该模型在语音表现力、控制力、情绪承接方面表现较强,并具备低时延、对话中可随时打断等特性。在数据收集中,团队筛选并整理大量包含丰富情感的语音数据,涵盖各种场景与情绪状态。在预训练阶段,团队对各模态交织数据进行深入训练,精准捕捉并高效压缩海量语音信息,通过 Scaling,最大程度实现语音与文本能力深度融合和能力涌现。在后训练阶段,团队使用了高质量数据与RL算法,进一步提供模型高情商对话能力与安全性,并使大模型同时兼具“智商”与“情商”。
2、架构支持多模态输入输出,涌现出较强声音控制、声音扮演等能力
在架构方面,豆包团队研发端到端框架,深度融合语音与文本模态,该框架面向语音生成和理解进行统一联合建模,实现多模态输入和输出效果,涵盖 S2S(语音到语音)、S2T(语音到文本)、T2S(文本到语音)、T2T(文本到文本)等多种模式。模型涌现多种能力:在声音控制方面,模型不仅能依照基础指令输出,还可遵循丰富的复杂指令;在声音扮演方面,目前模型部分方言和口音,主要源自于预训练阶段数据泛化,而非针对性训练。此外,模型支持实时联网功能,能够根据问题,动态获取最新信息,问题回答时效性强。从测评结来看,豆包实时语音大模型在情绪理解和情感表达方面优势明显,整体满意度方面,豆包实时语音大模型评分为4.36,GPT-4o为3.18,豆包模型表现更优。
3、ToB和ToC端大模型齐飞,重视字节跳动等相关产业链投资机会
ToB和ToC端大模型齐飞,建议重视国产算力产业链:
(1)【国产算力芯片】推荐标的:中兴通讯;受益标的:寒武纪、海光信息等;
(2)【字节/阿里/腾讯/百度等AIDC供应商】推荐标的:润泽科技、宝信软件;受益标的:光环新网、世纪互联、大位科技、东方国信、云赛智联、奥飞数据、万国数据、科华数据等;
(3)【液冷】推荐标的:英维克;受益标的:申菱环境、同飞股份、网宿科技、科华数据、高澜股份、申菱环境、依米康、飞荣达等;
(4)【服务器电源】受益标的:欧陆通、麦格米特等;
(5)【柴油发电机】受益标的:科泰电源、潍柴重机等;
(6)【变压器】受益标的:金盘科技等;
(7)【铜连接】受益标的:博创科技、瑞可达、华丰科技、沃尔核材、鼎通科技、神宇股份等;
(8)【交换机及芯片】推荐标的:中兴通讯、盛科通信、紫光股份;受益标的:锐捷网络等;
(9)【服务器】推荐标的:中兴通讯、紫光股份;受益标的:浪潮信息、华勤技术、烽火通信;
(10)【光通信】推荐标的:中际旭创、新易盛、天孚通信、中天科技、亨通光电;受益标的:华工科技、光迅科技、长光华芯、源杰科技等;
(11)【通信模组】推荐标的:广和通;受益标的:移远通信、美格智能、华测导航等。
风险提示:AI及云计算发展不及预期、机柜上架不及预期、行业竞争加剧等
证券研究报告:《开源证券—行业点评报告—字节发布豆包实时语音模型,重视AI产业链—通信团队》
对外发布时间:2025年01月20日
报告发布机构:开源证券股份有限公司
本报告分析师:蒋颖
分析师执业编号:S0790523120003
蒋颖 开源证券通信首席分析师
中国人民大学经济学硕士、理学学士,商务英语双学位。2017-2023年,先后就职于华创证券、招商证券、信达证券,2023年12月加入开源证券研究所,深度覆盖AI算力产业链、新型工业化、工业机器人、卫星互联网、自动驾驶、物联网、5G产业链等。曾获2024年新浪金麒麟“菁英分析师”通信第4名;2022年wind“金牌分析师”通信第4名;2020年wind“金牌分析师”通信第1名;2020年新浪金麒麟“新锐分析师”通信第1名;2020年21世纪“金牌分析师”通信第3名;2019年新浪金麒麟“最佳分析师”通信第5名。
陈光毅 开源证券通信组成员
北京大学物理学博士,凝聚态物理专业。2024年2月加入开源证券研究所,曾就职于信达证券研究开发中心,从事通信行业研究工作,主要覆盖光模块、光器件、光芯片、卫星通信、通信新能源、自动驾驶等领域。
雷星宇 开源证券通信组成员
伦敦国王学院理学硕士,公司金融专业。2024年4月加入开源证券研究所,从事通信行业研究工作,主要覆盖海外算力、液冷、AIDC、服务器、交换机、通信基站等领域。
香港中文大学硕士,金融工程专业。2023年7月加入开源证券研究所,2025年1月加入开源通信团队,曾就职于财通证券,首钢基金,主要覆盖AI铜连接、物联网、卫星通信、光通信、自动驾驶等领域。
欢迎关注开源通信
获取更多通信资讯