字节AI,国内第一,全球第二

汽车   2024-12-18 17:31   广东  
2024年的最后一个月,字节跳动的 AI 业务交出了一份亮眼的成绩单。

在全球 AI 应用竞争格局中,豆包已经成为用户规模最大的国产 AI 产品。

11月全球月活跃排行榜显示,豆包 App 以 5998 万 MAU 的成绩仅次于 OpenAI 的 ChatGPT,稳居全球第二。其海外版本 Cici 也取得了 1267 万 MAU,位列全球第22位。

从具体数据来看,据量子位统计,截至11月底,豆包 App 在 2024 年的累计用户规模已突破 1.6 亿,每日平均新增用户下载量稳定维持在 80 万。

在日活跃用户(DAU)方面,豆包以接近 900 万的规模和超过 15% 的增长率,远超第二名 Kimi 的 300 万 DAU,进一步巩固了其在国内 AI 应用市场的领先地位。

1、研发背景和发展历程

字节跳动一直重视 AI 技术。

早在2012年,字节就自研了第一版推荐引擎,并在2016年成立了AI Lab。

然而,随着 AI Lab 核心人员的相继离职,字节在 AI 领域的探索逐渐放缓。

直到 ChatGPT 的横空出世,公司意识到在大语言模型领域的发展相对滞后,并促使字节跳动 CEO 梁汝波在 2024 年初的全员会上进行深刻反思。

为了赶上这场 AI 技术革命,字节跳动迅速调整战略布局,采取一系列措施,包括大规模招募 AI 人才、成立专门的AI部门、整合内部资源、实施赛马机制等,以加速豆包大模型的研发进程。

豆包最初以「云雀」为名,主要服务于公司内部产品,是国内首批通过算法备案的大模型之一。

2023 年 11 月,字节跳动成立专注于 AI 应用的 Flow 部门,将其提升至与抖音、火山、飞书等同等重要的业务部门地位。

随后在 12 月底,公司推出了面向海外市场的 AI 开发平台 Coze,为全球开发者提供快速构建 AI 应用的能力。

进入 2024 年,字节跳动的 AI 布局进一步加速。年初,公司推出了 Coze 的国内版本「扣子」平台。同年 5 月,公司正式发布豆包大模型,并基于该模型推出了 50 余个业务应用。

值得注意的是,豆包大模型在 B 端市场采取价格战,将价格定位比同行低 99%。

同月,公司还推出了支持图片和视频生成的「即梦 AI」,并着眼于开发类似 Sora 的高阶视频生成能力。

「豆包」App 在 8 月上线后,也开启了快速迭代的产品发展之路。

2024年9月,字节跳动一次性发布了多个重要模型,包括豆包视频生成模型、豆包音乐模型以及豆包同声传译模型,扩展了产品的多模态能力。

紧接着在 10 月,公司推出了首款 AI 智能体耳机 Ola Friend,使豆包生态从软件延伸到了硬件领域。

在视觉创作方面,11 月份,豆包推出了视频生成内测功能,支持用户通过图片和文字一键生成视频内容,并能实现多镜头编排。到了 12 月,又上线了图片理解功能,进一步完善了产品的视觉交互能力。

这一系列产品迭代,展现出字节跳动在 AI 领域全方位布局的决心。

在产品迭代和推广方面,字节跳动有一套系统化的策略体系。

首先是公司内部的赛马机制,典型案例是在视频生成领域同时推进 AI Lab 的 PixelDance 和 Seed 的 Seaweed 两个项目,通过竞争促进技术突破和产品创新。

市场推广层面,字节跳动的特点是「大力出奇迹」。

通过大规模广告投放,豆包 App 在今年 5-7 月实现日新增用户从 20 万到 90 万,并在 9 月用户规模破亿。其次是深度整合旗下产品生态,通过在抖音、今日头条等现有产品中设置AI功能入口,实现流量的高效转化。

商业化探索方面,目前 AI 产品主要以免费形式提供,但字节跳动也在积极尝试多元化的商业模式。

考虑到中国市场的特点,字节认为单纯的付费订阅模式可能难以走通,而有限的使用时长和轮次又制约了广告变现空间,因此正在探索更具商业潜力的产品形态。

据相关报道援引知情人士透露的消息,字节跳动管理层认为,「豆包的相关数据已经是国内产品第一梯队,类似 ChatGPT 这种基于文本的对话类产品,大概率不是最理想的产品形态。」

2、Flow 部门

Flow 部门是字节跳动为了发展 AI 业务而专门成立的核心部门,负责打造 C 端 AI 产品,以及探索新的 AI 应用场景,如 AI 智能体耳机 Ola Friend、AI 生成视频等。

(1)部门架构

Flow 部门下设三个子部门,分别为 AI 产品团队 Flow、大模型研发团队 Seed 和产品研发支持团队 Stone。

AI 产品团队 Flow:专注于各类 AI 产品的策划、设计与优化等工作,致力于打造满足用户需求和市场竞争的 AI 应用。

大模型研发团队 Seed:主要承担大模型底层技术的研发工作。

产品研发支持团队 Stone:侧重于为产品研发过程提供全方位的支持,包括但不限于数据处理、算法优化、技术运维等,确保整个研发流程的顺畅进行和产品的稳定运行。

(2)Flow 部门的核心人员

朱文佳 - 整体业务负责人

朱文佳曾担任百度搜索部主任架构师,是百度网页搜索部技术副总监杨震原手下的得力干将,在百度积累了丰富的搜索及相关技术经验。

2015 年,朱文佳加入字节跳动,主要负责算法工作,是今日头条算法技术的 TOP3 人选。

2019 年 9 月,朱文佳成为今日头条 App 的新晋负责人,并直接向张一鸣汇报。之后他相继接管了西瓜视频和皮皮虾,这三个产品在内部被定义为 「大头条体系」。

2019 年 11 月 15 日,朱文佳出任今日头条 CEO ,全面负责今日头条的战略规划和业务发展。

2021 年 2 月 26 日,朱文佳调任字节系旗下的 TikTok,负责产品技术等业务线。

2024 年,朱文佳被任命为字节跳动 AI 模型开发负责人,统筹海内外团队的研发工作,回归到字节跳动的核心技术研发领域,肩负起带领团队开发 AI 模型的重任。

朱骏 - 字节跳动的产品和战略副总裁、Flow的产品负责人

朱骏是字节跳动的产品和战略副总裁,也是字节跳动 AI 模型产品的负责人,

2017 年底,Musical.ly 被抖音收购后,朱骏加入字节跳动,开始在字节跳动的产品体系中承担重要角色.

2019 年上半年,朱骏开始负责抖音国内产品,向张楠汇报。

2019 年 10 月,朱骏出任 TikTok 的产品负责人,负责 TikTok 在海外市场的产品战略规划与业务发展。

2020 年 5 月,朱骏担任字节跳动产运与战略副总裁,开始从更宏观的层面参与字节跳动的整体业务规划与战略布局。

2020 年 7 月,朱骏接任字节跳动战略投资负责人一职,负责字节跳动的战略投资项目,通过投资与并购等方式,为字节跳动的业务拓展与技术创新寻找新的增长点。

洪定坤 - 字节跳动的技术副总裁,Flow 部门的技术负责人

洪定坤毕业于北京邮电大学计算机系,2008 年本科毕业。

洪定坤 2007 年至 2013 年在百度任职,担任百度贴吧的技术经理,是百度社区的主要设计者之一。2013 年至 2014 年短暂加入小米,担任技术总监.

2014 年正式加入字节跳动,担任技术总监,负责效率工程部 。后来升任技术副总裁,主管搜索与发展业务,廖宝华、陈松林、李翰等人向他汇报。

2024 年,担任字节跳动新成立的 AI 部门 Flow 的技术负责人.

3、主要产品和业务

(1)豆包大模型

豆包大模型是字节跳动自主研发的基础大模型,于 2024 年 5 月 15 日在火山引擎 FORCE 原动力大会上正式发布。

豆包的前身是「云雀」大模型,是国内首批通过算法备案的大模型之一。该模型支持 256K 长文本处理,日均处理 1200 亿 Tokens 文本,生成 3000 万张图片,具备强大的理解、生成和逻辑推理能力。

豆包大模型主要通过火山引擎对外提供服务,豆包大模型家族包含多种模型,例如豆包通用模型 pro、lite、角色扮演模型、语音合成模型、声音复刻模型、语音识别模型、文生图模型、Function call 模型、向量化模型等。

同时,今日头条已整合了豆包 AI 功能。用户可以在今日头条 App 首页右上角找到豆包 AI 功能入口,直接使用豆包大模型提供的服务,例如 AI 搜索、内容创作、文件对话和阅读总结等。

抖音也整合了豆包 AI 功能。其中最主要的应用是 AI 搜索功能,用户可以使用豆包大模型进行更精准的搜索,并获得更符合需求的短视频内容推荐。

此外,抖音本地生活推荐功能也可能接入了豆包大模型,为用户提供更精准的本地商家推荐。

豆包大模型已应用在多个产品中,例如豆包 App、扣子、剪映、即梦等。

(2)主要AI应用

豆包App/Cici(海外)

豆包是一款面向 C 端用户的 AI 对话应用,提供多种功能,例如聊天、问答、创作、搜索等。

豆包 App 的产品定位是一个综合性的 AI 智能体 (AI Agent) 平台,通过不同的智能体满足用户在各种场景下的需求,例如 AI 图片生成、全能写作助手等。

豆包在国内的月活跃用户已达到 2600 万,累计创建了 800 万+ 智能体。在全球范围内,豆包 APP 的月活跃用户数仅次于 OpenAI 的 ChatGPT,位列全球第二。

扣子/Coze(海外)

扣子是字节跳动于 2024 年 2 月推出的面向国内开发者的智能体开发平台,与豆包平台深度整合。

它允许用户自己创建定制化的聊天机器人,并且这个机器人能将各种功能节点(如插件、模型、代码)按照一定的顺序和逻辑关系连接起来,创建出复杂的业务流程,以实现特定的任务或功能。

扣子的主要功能和特点:

  • 支持快速创建 AI 智能体:扣子提供简单易用的工具,帮助开发者快速创建 AI 智能体,即使没有编程经验的用户也可以轻松上手。

  • 支持多种定制化选项:开发者可以根据自己的需求定制智能体的功能、回答风格、声音、形象、记忆等。

  • 与豆包 App 生态整合:扣子创建的智能体可以直接发布到豆包 App 上,与豆包的用户群和生态系统深度整合。

  • 提供插件工具集:扣子集成了一系列插件工具,帮助开发者扩展智能体的功能和应用场景。


剪映/CapCut(海外)

剪映和 CapCut 是字节跳动旗下的视频剪辑工具,剪映主要面向中国市场,而 CapCut 则面向海外市场。这两个产品都整合了豆包大模型的功能,例如 AI 生成文本、语音和图像等,以提升用户的创作效率和体验。

据界面新闻报道,剪映和CapCut的收入在 2024 年实现了超过三位数增长,总收入接近百亿人民币,全球月活跃用户超过 8 亿。

即梦/Dreamina(海外)

即梦是字节跳动旗下一款文生图、文生视频产品,支持通过自然语言及图片输入,生成高质量的图像及视频。

尽管目前公开信息有限,但从字节跳动的相关报道来看,他们正在提升即梦的产品优先级,并投入大量资源进行开发。

Ola Friend 智能耳机

Ola Friend 是字节跳动在10 月 10 日推出的首款 AI 智能体耳机,内置豆包大模型,用户可以通过语音与豆包进行交互,无需连接手机。

Ola Friend 的硬件团队即来自字节跳动在2023年9月收购的开放式耳机厂商原 Oladance 团队。

Ola Friend 的核心功能和技术特色:

  • 随时随地唤醒 AI: 用户戴上耳机,说出「豆包豆包」即可唤醒豆包大模型,进行多轮对话和信息查询。

  • 开放式耳机设计:Ola Friend 采用开放式耳机设计,佩戴舒适,同时也能够感知周围环境的声音。

  • 强大的语音交互体验: Ola Friend 搭载了字节跳动领先的 Seed-TTS 语音合成技术和 Seed-ASR 语音识别技术,能够在嘈杂环境中准确识别用户的语音,并提供自然流畅的语音合成效果。

  • 多功能个人 AI 助理:Ola Friend 可以提供信息查询、旅游出行、英语学习、情感交流等多种功能,为用户提供个人化的 AI 服务。

  • 高音质音效:Ola Friend 采用了 10mm 动圈发声单元、动态 EQ1.0、动态低音补偿等技术,提升了耳机的音质。

  • 方言识别:Ola Friend 可以识别多种方言,例如四川话,方便更多用户使用。


4、小结

在这一轮生成式AI浪潮中起步较晚的字节跳动,通过系统化的战略布局和高效的执行力,已经成为目前拥有最全面生成式AI模型矩阵、最丰富AI应用生态的科技公司之一。

字节跳动通过豆包大模型及其应用生态展现出独特的竞争优势。一方面,公司依托庞大的内容生态和用户基础,为大模型应用提供了丰富的训练数据和应用场景;另一方面,通过在视频创作、图文生成等垂直领域的深耕,形成了差异化的技术积累。

未来,随着生成式 AI 技术的持续演进,字节跳动有望在更多垂直领域发挥其独特优势,为用户带来更多创新的 AI 应用体验。

- END -




壹汽车
关注汽车行业,传播智能出行行业新观点
 最新文章