2024年即将落幕,在这一年最后一个月,字节跳动的AI业务交出了一份亮眼的成绩单。在全球AI应用竞争格局中,豆包已经成长为用户规模最大的国产AI产品。
11月全球月活跃排行榜显示,豆包App以5998万MAU的成绩紧随OpenAI的ChatGPT之后,稳居全球第二。其海外版本Cici也取得了1267万MAU,位列全球第22位。
从具体数据来看,据量子位统计,截至11月底,豆包App在2024年的累计用户规模已突破1.6亿,每日平均新增用户下载量稳定维持在80万。
在日活跃用户(DAU)方面,豆包以接近900万的规模和超过15%的增长率,远超第二名Kimi的300万DAU,进一步巩固了其在国内AI应用市场的领先地位。
数据来源:AI产品榜、量子位智库
01
研发背景与发展历程
字节跳动对AI技术的重视由来已久。
早在2012年,他们就自主研发了第一版推荐引擎,2016年更是成立了AI Lab。但随着AI Lab核心成员陆续离开,字节在AI领域的步伐逐渐放缓。
直到ChatGPT横空出世,字节跳动CEO梁汝波在2024年初的全员会上深刻反思,意识到公司在大语言模型领域已落后。为了追赶这场AI技术革命,字节跳动迅速调整战略,大规模招募AI人才、成立专门AI部门、整合内部资源、实施赛马机制,全力加速豆包大模型研发。豆包最初以“云雀”之名,主要服务公司内部产品,是国内首批通过算法备案的大模型之一。
2023年11月,字节跳动成立Flow部门,专注AI应用,将其提升至与抖音、火山、飞书等业务部门同等重要地位。同年12月底,推出海外AI开发平台Coze,助力全球开发者快速构建AI应用。
2024年,字节跳动AI布局全面加速。年初推出Coze国内版“扣子”平台,5月发布豆包大模型及50余个业务应用,B端市场以低价策略抢占份额。同月推出“即梦AI”,发力高阶视频生成。
8月“豆包”App上线后快速迭代,9月一次性发布多个重要模型,扩展多模态能力。10月推出首款AI智能体耳机Ola Friend,将豆包生态延伸至硬件领域。11月视频生成内测功能上线,支持图片、文字一键生成视频;12月图片理解功能推出,完善视觉交互能力。
这一系列迭代彰显字节跳动全方位布局AI的决心。
在产品迭代推广上,字节跳动内部赛马机制激发技术突破,如视频生成领域同时推进PixelDance和Seaweed项目。
市场推广上,大规模广告投放让豆包App 5-7月日新增用户从20万飙升至90万,9月用户规模破亿。同时深度整合旗下产品生态,通过抖音、今日头条等产品设置AI功能入口,实现流量高效转化。
商业化方面,目前AI产品主要免费提供,但字节跳动正探索多元化商业模式,因中国市场特点使付费订阅模式受限,有限使用时长和轮次又制约广告变现空间,故积极寻找更具商业潜力的产品形态。
据知情人士透露,字节跳动认为豆包数据已达国内产品第一梯队,类似ChatGPT的文本对话类产品非最理想形态。
02
Flow部门
Flow部门是字节跳动为发展AI业务而精心打造的核心部门,肩负着打造C端AI产品和探索全新AI应用场景的重任,比如AI智能体耳机Ola Friend、AI生成视频等前沿项目。
(1)部门架构
Flow部门下设三大子部门,各司其职又协同作战:
AI产品团队Flow:
他们是产品的灵魂塑造者,专注于各类AI产品的策划、设计与优化,凭借敏锐的市场洞察和用户需求把握,打造出一个个既满足用户所需又能在市场竞争中脱颖而出的AI应用。
大模型研发团队Seed:
他们是技术的深耕者,主要承担大模型底层技术的研发工作,为AI产品提供坚实的技术支撑,不断突破技术瓶颈,让AI模型更智能、更精准。
产品研发支持团队Stone:
他们是研发的坚强后盾,全方位为产品研发过程提供支持,从数据处理、算法优化到技术运维,确保整个研发流程顺畅无阻,让产品稳定运行,为用户带来无缝的使用体验。
(2)Flow部门的核心人员
朱文佳:
作为整体业务负责人,朱文佳的履历堪称辉煌。他曾是百度搜索部主任架构师,百度网页搜索部技术副总监杨震原的得力干将,在百度积累了丰富的搜索及相关技术经验。
2015年加入字节跳动后,一路从算法工作做到今日头条App负责人,再到今日头条CEO,全面负责战略规划和业务发展。2021年调任TikTok,负责产品技术等业务线。2024年,他被任命为字节跳动AI模型开发负责人,统筹海内外团队的研发工作,回归到字节跳动的核心技术研发领域,肩负起带领团队开发AI模型的重任。
朱骏:
作为字节跳动的产品和战略副总裁、Flow的产品负责人,朱骏在公司产品体系中扮演着举足轻重的角色。
2017年底,随着Musical.ly被抖音收购,朱骏加入字节跳动。此后,他先后负责抖音国内产品、TikTok的产品战略规划与业务发展,以及字节跳动产运与战略副总裁、战略投资负责人等职,从宏观层面为公司的业务拓展与技术创新寻找新的增长点。
洪定坤:
技术副总裁、Flow部门的技术负责人,洪定坤的学术背景和工作经历都十分扎实。毕业于北京邮电大学计算机系的他,曾在百度担任贴吧技术经理,是百度社区的主要设计者之一。
短暂加入小米担任技术总监后,于2014年正式加入字节跳动,历任技术总监、技术副总裁,主管搜索与发展业务。2024年,他担任新成立的AI部门Flow的技术负责人,为部门的技术发展掌舵领航。
Flow部门汇聚了众多行业精英,他们携手并肩,以创新为驱动,不断探索AI技术的边界,为字节跳动在AI领域的持续发展注入强劲动力。
03
主要产品和业务
(1)豆包大模型
豆包大模型是字节跳动自主研发的“智慧大脑”,于2024年5月15日在火山引擎FORCE原动力大会上正式亮相。它的前身“云雀”大模型,是国内首批通过算法备案的佼佼者。
这个模型的“肚量”可不小,能支持256K长文本处理,每天能“消化”1200亿Tokens文本,还能“创作”出3000万张图片,理解、生成和逻辑推理能力都相当了得。
豆包大模型主要通过火山引擎对外提供服务,它的“家族成员”众多,包括豆包通用模型pro、lite、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生图模型、Function call模型、向量化模型等。同时,今日头条和抖音都已“拥抱”豆包AI功能。
在今日头条App首页右上角,用户就能找到豆包AI功能入口,享受AI搜索、内容创作、文件对话和阅读总结等服务。
抖音里,AI搜索功能让用户能进行更精准的搜索,获得更符合需求的短视频内容推荐,本地生活推荐功能可能也接入了豆包大模型,为用户提供更精准的本地商家推荐。
豆包大模型还“活跃”在豆包App、扣子、剪映、即梦等多个产品中。
(2)主要AI应用
1.豆包App/Cici(海外):
豆包App是面向C端用户的AI对话“小伙伴”,聊天、问答、创作、搜索等功能样样精通。
它定位为综合性AI智能体(AI Agent)平台,不同智能体能满足用户在各种场景下的需求,比如AI图片生成、全能写作助手等。
在国内,豆包App月活跃用户已达2600万,累计创建了800万+智能体。在全球范围内,豆包APP月活跃用户数仅次于OpenAI的ChatGPT,稳居全球第二。
2.扣子/Coze(海外):
扣子是字节跳动2024年2月推出的国内开发者智能体开发平台,与豆包平台“亲密无间”。
它让用户能自己动手创建定制化的聊天机器人,这个机器人还能把各种功能节点(如插件、模型、代码)按顺序和逻辑关系串联起来,打造出复杂的业务流程,完成特定任务或功能。
扣子的主要功能和特点包括:
支持快速创建AI智能体,简单易用的工具让无编程经验的用户也能轻松上手
支持多种定制化选项,功能、回答风格、声音、形象、记忆等都能按需定制
与豆包App生态整合,创建的智能体可直接发布到豆包App上;提供插件工具集,助力开发者拓展智能体功能和应用场景
剪映/CapCut(海外):
剪映和CapCut是字节跳动旗下的视频剪辑“神器”,剪映主打中国市场,CapCut则风靡海外市场。
它们都整合了豆包大模型的“超能力”,如AI生成文本、语音和图像等,让用户的创作效率和体验直线飙升。
据界面新闻报道,2024年剪映和CapCut的收入实现了超过三位数的增长,总收入接近百亿人民币,全球月活跃用户突破8亿大关。
即梦/Dreamina(海外):
即梦是字节跳动旗下专注于文生图、文生视频的产品,只需自然语言及图片输入,就能“变出”高质量的图像及视频。
虽然目前公开信息有限,但从字节跳动的相关报道来看,他们正全力提升即梦的产品优先级,并投入大量资源进行开发。
Ola Friend智能耳机:
Ola Friend是字节跳动10月10日推出的首款AI智能体耳机,内置豆包大模型,用户只需语音呼唤“豆包豆包”就能唤醒它,无需连接手机即可进行多轮对话和信息查询。它的硬件团队来自字节跳动2023年9月收购的开放式耳机厂商原Oladance团队。
Ola Friend的核心功能和技术特色有:
随时随地唤醒AI,开放式耳机设计佩戴舒适且能感知周围环境声音
搭载Seed-TTS语音合成技术和Seed-ASR语音识别技术带来强大的语音交互体验
多功能个人AI助理提供信息查询、旅游出行、英语学习、情感交流等服务
高音质音效采用10mm动圈发声单元、动态EQ1.0、动态低音补偿等技术
还能识别多种方言如四川话,方便更多用户使用。
04
小结
在这一轮生成式AI浪潮中,起步稍晚的字节跳动凭借系统化的战略布局和高效的执行力,已经迅速崛起,成为拥有最全面生成式AI模型矩阵、最丰富AI应用生态的科技公司之一。
通过豆包大模型及其应用生态,字节跳动展现出独特的竞争优势。
一方面,依托庞大的内容生态和用户基础,为大模型应用提供了丰富的训练数据和应用场景;
另一方面,在视频创作、图文生成等垂直领域深耕细作,形成了差异化的技术积累。
未来,随着生成式AI技术的持续演进,字节跳动有望在更多垂直领域发挥其独特优势,为用户带来更多创新的AI应用体验。