[研讯]字节豆包,比肩ChatGPT!

科技   2024-12-19 22:18   北京  

为财经人士倾心打造的投研资讯平台



预期差就是生产力

—— 京北月光




字节火山引擎原动力大会点评


1、豆包大模型日均调用量大幅增长。豆包大模型日均调用量从5月的1200亿→7月5000亿→9月1.3万亿→12月4万亿。其中信息处理场景3个月调用量增长39倍,客服销售调用量增长16倍,硬件终端增长13倍,AI工具场景增长9倍。我们推测,B端场景的应用情况和调用量可能远超C端。

2、重磅发布视觉理解模型。用户可以同时输入文本和图像,模型综合理解并给出准确的回答,不仅能够做到图像内容的识别,还能够进行复杂的逻辑计算,比如解高数题。模型定价0.003元/千token,比行业平均价格降低85%,相当于一元可以同时处理284张720p的图片。

3、升级通用大模型豆包pro。性能方面,专业知识领域,豆包pro相比5月版本提升54%,效果领先于gpt4;综合任务处理能力提升32%,与gpt4持平;指令遵循提升9%;逻辑推理能力提升13%,数学能力提升43%。能力全方位对齐gpt4,价格只有gpt4的八分之一。目前在法务案情判断、企业舆情判断已得到良好试用。

4、其他多个模型升级/发布。升级豆包音乐模型:支持3min完整音乐作品呈现,支持复杂结构音乐创作,并且可以局部修改。升级文生图模型:一键p图+一键海报。发布豆包3D生成模型:合作英伟达veOmniverse平台,形成物理世界仿真模拟器。

5、推出扣子1.5和HiAgent 1.5:扣子1.5提供新的应用开发环境,支持一键发布小程序、H5;增强多模态能力,升级语音识别和交流能力;推出模板商店。HiAgent 1.5:超过100个行业应用模板,提供更强的知识融合效果,打造AI知识助手。


强call字节AI基础设施产业链

#字节正在向AI基础设施投资数十亿美元,国内外并行布局。2024年6月,马来西亚投资、贸易&工业部长曾表示,字节跳动计划投资约21.3亿美元在马来西亚建设数据中心;10月曼谷邮报报道,字节旗下子公司BytePlus正考虑2025年在泰国建设数据中心;5月,字节发布自建华东数据中心招标项目,计划将于2025年建成投用。去年9月,字节已建立起超过1万张卡的Ampere架构GPU(A100/A800)集群,并提出了一个用于训练大语言模型的生产系统MegaScale。


#火山引擎迅速崛起,AI重塑云计算格局。根据IDC数据显示,2023H2火山引擎成为国内GenAI IaaS领域份额最大的云厂商,2023年火山引擎营收增速超过150%。在算力基础设施提供上,智谱AI、月之暗面、Minimax、零一万物最初都在火山引擎上进行训练,百川智能也部分使用了火山引擎的算力。在大模型产品上,豆包APP的11月MAU达到5998万,在全球月活跃排行榜上排名第二。


#字节AI布局: 2016年,抖音上线,成立人工智能实验室;2020年6月,企业服务平台“火山引擎”上线;2023年6月,火山引擎的MaaS大模型服务平台“火山方舟”上线;2023年8月豆包大模型上线(原名云雀);2023年11月字节成立Flow部门,专注AI应用;2024年5月正式发布豆包大模型,通过火山引擎对外提供服务。目前字节下设三大AI部门推进大模型到AI应用落地(Seed负责大模型研发、Flow负责AI产品应用开发,Stone负责技术支持)。


字节目前是国内AI基础设施投资增量最大的互联网大厂,国内外投资步伐都较为激进。关注字节AI基础设施投资相关机会。


#重点推荐:光模块(光迅科技、华工科技、中际旭创、天孚通信、新易盛)、液冷(英维克、申菱环境、高澜股份)、AIDC(润泽科技)、交换机(锐捷网络、紫光股份、中兴通讯)。


第一点的话,Token大幅超预期。10月底1.5万亿,半个月大概增长了小3倍,这是后面我们跟踪字节豆包链最核心的指标。#最直接利好就是计算机之王。

第二个,to c外主要发力在to b。目前销售强KPI考核,从昨天大会来看,to b agent智能体空间最大最快跑通在这个营销环节,在消费行业(美国Salesforce的agent已经打了样),当然to c端侧新入口字节很重视,这个说了一个月了。#TOb汉得和端侧花开三朵

第三个,字节链持续性,是按年度计的。周末我就说,未来两年的字节链就是过去2年前华为链,更重要是AI带来全社会生产力 人均GDP一个提升啊,字节已经打通从芯片硬件到数据到应用。


今年AI应用到什么量级?


因为部分渠道已经报道了豆包年底的MAU目标是1亿,基于此,我们来聊聊明年AI应用会到一个什么用户量级,以及因此会需要什么级别的算力。


首先,按照ZJ的习惯,KPI一定是非常具有挑战性的。1亿的MAU到了25年会到多少?个人认为保守2亿,激进点3亿也不为过。刚一位朋友说的很好,豆包其实还没发力,什么叫发力?当你地铁电梯看到广告的时候。从我个人刷抖音体验来看,豆包似乎也没全量推送。到了3亿什么水平?


OpenAI的ChatGPT到2024年底目标是超过4.3亿MAU、2.1亿周活、7千万日活。也就是豆包明年如果全量推广, 有希望在2025年底达到今chatGPT的水平。


值得吗?或者说,能赚回来吗?


值得。简单来说,ZJ就是国内最强的商业化机器,几乎实现了各个商业模式的闭环:广告、电商、游戏(发行)、O2O,甚至金融/教育/硬件等等等等。只要前端能获取、刻画、截留用户需求,后端就能交易闭环。而无论豆包还是chatGPT,实质上都有潜力成为“超级入口”。比如仅仅替代搜索,就可以实现巨大商业价值。用朋友话说,百度过去几年搜索赚的钱,像卖BF一样暴利。从网民整体来看,他们不一定人人使用移动端搜索,但一定刷抖音或头条。不少人已经拿豆包当日常搜索用。如果你好奇为什么豆包的MAU涨得竖起来了,别问同龄人,问问身边亲戚朋友。因此,如果能用几百亿,烧出一个若干年后可能现金流就每年几百亿的入口,算长期ROI也是划得来的,何况内部很多场景可以复用算力。


需要多大的算力?


之前文章我们提过capex的问题(已删),不如从用户规模角度,我们自己推导下算力需求有多少。

除了豆包,推理算力需求还来自:1)ZJ内部自用,例如客服场景、视频审核、抖音评论生成、飞书等等,随着内部应用AI化只会越来越多。2)外部调用,基于火山引擎,支持荣耀、OPPO、小米等等API调用。上述三个部分,每个目前都是几千亿token/每日,意味着合计总量接近1万亿token/每日。


如果明年豆包MAU从1亿到2-3亿、内部应用AI化加速、外部toB爆发(今年基数低),那么日均token量很可能是数万亿。具体是3万亿还是5万亿还是10万亿,存在很多不确定性。比如多模态增加、多步骤的agent出现、类似sora这种token吞金兽是否上线等等。








完整内容,更多调研纪要,提前收到,硬核精华资讯流,扫码加入:

如果觉得文章有点收获,点右上角点个在看并分享到朋友圈,看完顺手点个点赞和在看

免责声明:本文及公众号任何文章之观点,皆为交流探讨之用,不构成任何投资建议。


京北月光
顺势借势为主,低潜埋伏为辅,擅长融合题材、基本面、技术面,预判超级趋势
 最新文章