豆包大模型家族全新升级,新发视觉理解模型成为最大亮点
12月18日火山引擎举办FORCE原动力大会,升级了豆包家族系列大模型,包括:新发布视觉理解模型和3D生成模型,升级豆包通用模型pro(对标GPT-4o)、视频生成模型(动态海报)、音乐模型(生成3分钟作品,复杂音乐创作)、文生图模型(一键P图/海报)。其中,视觉理解模型成为最大亮点,可同时输入文本和图像的相关问题,模型能综合理解并给出准确回答。豆包大模型的日均tokens调用量最新已超4万亿,较5月发布时增长超33倍。我们认为,豆包模型及相应AI应用正快速渗透,AI赋能B/C端时代有望加速到来。
豆包视觉理解模型跨模态能力突出,低价推广有望解锁更多价值场景
豆包视觉理解模型展现出卓越的视觉理解与跨模态能力:1)更强内容识别。能识别物体类别、形状、纹理等,理解物体之间关系和空间布局;2)更强理解推理能力。根据所识别的内容进行复杂的逻辑计算,如拍题解题等;3)更细腻视觉描述。视觉理解模型输入定价为每千tokens 0.003元,比行业平均价格低85%,我们认为,视觉理解模型能拓展豆包大模型的场景边界,拓展教育、旅游、电商、金融、医疗、物流等领域。较低的模型定价有望加速推广应用场景,提高字节系AI应用产品用户粘性。
豆包通用模型pro升级后全面对标GPT-4o,价格仅为后者1/8
升级后的豆包通用模型pro能力大幅提升:综合任务处理能力上提升32%,和GPT-4o持平;指令遵循能力提升9%;代码能力提升58%;专业知识领域提升54%,这一效果略微领先GPT-4o;逻辑推理上提升13%;在数学上大幅提升43%。综合能力已全面对齐GPT-4o,使用价格只有GPT-4o的1/8。我们认为,豆包Pro凭借其更强的模型效果和更低的推理成本,将进一步推动企业AI升级,以及增强C端用户体验和使用量。
企业端产品:火山方舟、扣子、HiAgent帮助构建AI能力中心
1)火山方舟提供全栈MaaS能力,支持模型精调、推理、评测等全方位功能,及丰富插件、扩展API和高代码解决方案,升级上下文缓存和记忆加工加载技术,强化AI搜索和推荐。2)扣子为中国最具活力的智能体开发社区,已有超100万的活跃开发者,创造了超200万智能体应用。1.5版本推出,支持发布成小程序、H5、API等应用形态,增强了多模态能力,可与各种硬件集成。3)HiAgent支持企业私有部署和混合部署模式,沉淀出超100个行业的应用模板,增强知识融合效果,帮助企业打造AI知识助手。
AI应用大时代已来,探索字节AI产业链投资价值
从C端AI应用看,字节自己推出的AI APP应用相对闭环生态;AI智能硬件方面字节已推出AI智能耳机OLA friend,AI玩具显眼包(尚未正式发售),后续AI眼镜、AI机器人等值得期待。从B端AI合作看,我们梳理了产业链相关标的,具体请见研报原文。
风险提示:AI发展不及预期,用户反响不及预期,政策监管风险。本研报中涉及到未上市公司或未覆盖个股内容,均系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
相关研报
朱珺 分析师 S0570520040004 | BPX711
周钊 分析师 S0570517070006 | BQA910
关注我们
https://inst.htsc.com/research
访问权限:国内机构客户
https://intl.inst.htsc.com/research
免责声明