字节跳动:AI 落地,实力派玩家入局

学术   科技   2024-12-07 19:13   北京  

AI潮涌,字节跳动未能抢得先机,起步就已经是加速模式。从C端市场建立以豆包为代表的生成式AI应用矩阵,试图复制移动互联网时代的辉煌,到在B端市场打响模型服务价格战,来自实力派玩家的入局搅动行业风云与市场格局。

在当今科技迅猛发展的浪潮中, 生成式人工智能技术(生成式AI)无疑是最具变革性的力量之一。字节跳动正将目光聚焦于AI应用落地上。依托其深厚的技术积累、丰富的C端产品运营经验以及强大的市场开拓能力,字节跳动在短短一年多的时间里便成功推出了自主研发的豆包大模型及其一系列AI产品应用,迅速崛起成为行业中的关键玩家。

1


后来者发力:

技术加码,全力冲刺

在生成式AI领域的竞赛中,字节跳动起初反应较慢,2023年初才开始关注到GPT相关技术,但随后迅速布局生成式AI领域。其近150人的大模型团队,在短短一年多的时间内成功推出自主研发的包含11款模型在内的豆包大模型家族,并上线了超过10款AI应用。


字节跳动AI技术布局


全面布局生成式AI

从公司的发展历程来看,字节跳动在AI领域的探索是一个逐步深化的过程。2012年,字节跳动成立,并推出了基于智能推荐算法的资讯产品——今日头条。2016年,随着抖音的发布以及人工智能实验室的建立,字节跳动开始了对AI技术系统性的研发和积累。自2020年起,随着AI技术应用范围的扩大,字节跳动开始广泛地将这些先进技术融入到抖音、剪映等多个产品中,提升终端用户的使用体验。

但在这一轮大模型的竞赛中,字节跳动在行动上稍显迟钝,其对新技术的敏感度似乎不及一些创业公司。直到2023年初,字节跳动公司内部才开始讨论GPT相关技术。自2023年初起,字节跳动迅速调整战略,积极布局生成式AI领域,在产品研发及组织营层面,调动所有可用资源加速追赶,并快速在大模型开发及产品应用层面布局。

在模型研发层面,字节跳动快速发布自己的大模型并推出多款AI产品应用。2023年2月,字节跳动组建“Seed”团队,从国内外多个部门调集人才,专注于AI领域的语言与图像模态研究。同年6月,字节跳动旗下云服务平台火山引擎推出了“火山方舟”平台。到了2023年8月,字节跳动的豆包大模型(原名云雀大模型)通过备案并上线,同时基于该大模型的AI对话产品“豆包”也开启了对外测试。在2024年5月,字节跳动正式发布了自研的豆包大模型,通过火山引擎正式对外提供服务。

在团队人员层面,字节跳动设立了专门的技术团队和业务部门,加速推进AI技术的研发和产品创新。字节跳动的大模型团队,包括语言和图像两个团队。2023年11月,字节跳动成立了专注于AI创新业务的新部门Flow,该部门主要聚焦于AI大模型及AI应用层的产品研发。这一举措标志着字节跳动在AI领域的布局变得更加系统化和战略化。

字节跳动掌握了先进的深度学习、机器学习技术,并在计算机视觉、图像识别和自然语言处理等领域展现出卓越的技术实力。凭借深厚的技术积淀,字节跳动才能在较短的时间内发布自研的大模型,并迅速推出多款AI产品应用。

豆包大模型,迟到的破局者

相比百度、阿里等互联网企业自2019年开始陆续发布各自的大模型,字节跳动旗下的豆包大模型于2023年8月通过备案并上线,2024年5月正式发布。

豆包大模型实际上是一个具备多模态能力的“模型家族”,包括通用模型pro/lite、角色扮演模型、语音识别模型、文生图模型等11款模型。豆包大模型的核心优势在于其强大的数据处理能力、明显的价格优势、丰富多样的功能以及友好的交互体验。目前,字节跳动的豆包大模型在市场上已具有较强的竞争力和影响力。

字节跳动通过持续的模型优化,使得豆包大模型在模型性能、模型效果、推理成本方面表现出色。首先,在模型性能层面,豆包大模型在知识问答、文本生成、语言理解、视频生成等方面表现较好。例如,知识问答方面,通用模型集成了海量知识库,能快速进行信息的高效搜索和整合,准确回答工作、生活等多场景的问题;视频生成方面,全新推出的视频生成模型,拥有精准的语义理解能力,支持多动作多主体交互的内容生成以及强大的动态效果等,使得生成的视频更加灵动自然。

其次,在模型效果方面,经过大量的实际调用和测试,豆包大模型展现出了优异的表现。字节跳动内部多个业务接入豆包大模型,并且也邀请了多个行业客户参与测试。通过对这些大规模数据进行收集、整理和分析,大模型能够更好地学习各种行为,从而提高模型的生成能力和准确性。截至2024年9月,豆包大模型的日均Tokens使用量已经超过1.3万亿,豆包文生图模型日均生成图片5000万张,豆包目前日均处理语音85万小时,如此巨大的模型调用量,显然反映了市场对于豆包大模型使用体验和应用效果的认可。

另外,在推理成本层面,豆包大模型相较于其他大模型具有明显的价格优势。豆包主力模型(Doubao-pro-32k)在企业市场的定价仅为0.0008元/千Tokens,这意味着0.8厘就能处理1500多个汉字,比行业平均水平便宜99.3%。大模型成本的大幅降低将有助于更多企业客户以较低的投入推进大模型应用落地。

在实际应用中,豆包大模型展现出了强大的实力。在过去一年多的时间里,它已经被应用于字节跳动旗下的多个业务中,包括抖音、巨量引擎、飞书等50多个业务。豆包大模型为这些业务提供强有力的技术支持,使其在营销、电商、办公、创作等多场景中的业务对接效率显著提升,产品使用体验得到进一步优化。

除了自有产品接入豆包大模型之外,字节跳动还基于大模型推出了多款面向C端的创新产品,期望在AI时代打造出类似抖音这样的爆款应用,为用户提供更加智能化内容服务。在B端合作方面,豆包大模型通过火山引擎对外提供服务,为企业客户提供一站式的AI解决方案,助力企业实现智能化转型。

2


C端产品应用:

多领域尝试,打造AI创新产品矩阵

被誉为“超级App工厂”的字节跳动,C端产品应用覆盖内容、社交、创作等多个场景,这使得现有的产品生态与AI应用场景高度契合。字节跳动积极进军C端AI市场,并基于自研的豆包大模型迅速推出了一系列创新的AI产品应用。


字节跳动AI产品


主力明星应用豆包

豆包是字节跳动在人工智能助手领域推出的一个重要产品,它的定位是一个综合性的AI智能体平台。基于豆包大模型能力,豆包能够回答用户的各种问题,为用户提供丰富的知识和创意内容。用户可以通过网页、客户端、App、插件等多种形式使用豆包,并通过文字或语音形式与之对话。

豆包整体的交互形式以智能体的方式呈现,目前平台内的智能体包括3种类型:豆包默认智能体、豆包官方创建的智能体以及用户自己创建的智能体。在通用场景下,用户可以与默认智能体“豆包”进行聊天对话;而在其他场景下,用户可在应用内找到其他垂直领域的智能体来解决特定问题。综合来看,豆包具备多种功能,包括智能对话、虚拟社交、文本写作、图像及音乐生成、个性化智能体创建等,可满足用户在工作、娱乐、生活场景中的多样化需求。


豆包页面展示


作为字节跳动旗下的一款关键AI应用,豆包正展现出巨大的发展潜力。用户规模持续扩大和使用场景的不断拓展,使得豆包在AI领域的影响力逐渐增强。同时,豆包团队也在积极寻求商业模式的创新,以进一步增强自身在市场上的竞争力。

目前,豆包的用户规模正在持续增长。基于豆包强大的AI能力,越来越多的用户开始了解并使用豆包。根据量子位智库2024年9月发布的《AI大模型创业格局报告》,截至2024年8月,豆包历史下载量已经超过1亿次,月活跃用户数超过2600万,应用内智能体数量超过800万。在AI智能助手赛道上,豆包相比于其他同类产品,领先优势不断加大。同时,在国内众多AI应用中,豆包的用户规模一直保持领先地位。

其次,豆包正在逐步拓展更多的用户使用场景。目前,豆包的主要使用的场景包括在职场办公、社交陪伴、学习教育和生活服务等。随着用户需求的不断增加,豆包将更深入地了解用户需求和行为模式,进一步拓展使用场景。在各个细分的场景中,更好地满足用户的具体需求,解决实际问题。

此外,豆包也在积极探索商业化。随着豆包月活跃用户数持续增加,庞大的用户基础为豆包带来了更多的商业机会。一方面,用户数量的增长提升了豆包的广告价值。当用户在豆包应用内搜索特定产品或服务时,广告主可以投放定向广告,实现精准营销;另一方面,大规模的用户人群也为豆包的付费服务提供了潜在的基础。随着用户对豆包功能的认可和需求的增加,豆包未来可能会推出不同等级的会员制度,或者提供付费的高级功能,以满足部分用户的个性化需求。

垂类应用多面开花

字节跳动除了在AI智能助手领域推出的豆包之外,在其他领域也推出了多款创新产品应用,如AI创作类应用“星绘”、AI社交类应用“猫箱”、智能体开发平台“扣子”,这些应用满足了不同目标人群在各种使用场景中的需求。

在AI创作领域,字节跳动推出多款产品,包括星绘、即梦、即创等。以2024年4月上线的图片创作应用星绘为例,用户拍摄或上传3至20张照片,系统会自动生成个性化的AI分身,用户也可输入提示词来自定义AI形象。星绘专注于AI生图和虚拟形象创作,其具体功能包括AI换装、AI滤镜、AI改图、AI扩图、AI绘画等,能满足用户对图片创作的多样化需求。此外,星绘还提供大量不同风格的AI写真模板,用户创建AI分身后,可快速使用分身制作同款图片,在虚拟世界中体验不同穿搭,感受艺术创作的乐趣。


AI图片创作应用星绘页面展示


通过对星绘的体验,我们发现该产品的创造性主要在于它拥有强大的图片素材知识库,对提示词能精确识别,并通过人机协作生成逼真的且富有艺术感的自我形象图片。然而,在图片生成过程中,星绘在效果稳定性方面存在一些问题,有时候会出现手、脚等细节比例失衡甚至错乱的情况。未来,星绘需要在效果稳定性的细节上进一步优化产品,确保生成的图片更加准确和自然。

在AI虚拟社交领域,字节跳动于2024年3月推出AI社交应用“话炉”,该应用在4月11日更名为“猫箱”。在猫箱应用中,用户可以与各种由AI生成的虚拟角色进行交流。这些虚拟角色风格多样,涵盖了卡通动漫、言情、科幻等各种题材,满足不同用户对于各种风格的喜好。猫箱支持文字和语音两种输入方式,使得交流较为自然顺畅。在产品体验过程中,用户可自行创建角色和故事,也可直接参与他人发布的故事。用户在与虚拟角色对话时,基于原有的故事框架,用户的每一个决策都会影响故事的发展。这种高度的参与感让用户仿佛置身于一个真实的世界中,提升了互动的沉浸感。

根据量子位智库2024年9月发布的《AI陪伴产品8月用户数据报告》,在AI陪伴应用的历史下载量排名中,猫箱的总下载量排名第六,其8月新增下载量超过100万,展现出较快的增长速度。总体来看,猫箱为用户提供了一种全新的AI社交体验,其故事情节具有较高的自由度和个性化。然而,在社交内容的深度和新鲜感方面,猫箱还有一定的提升空间。未来,如何进一步提高用户留存率,保持用户活跃度,将是猫箱需要重点关注的问题。

在AI智能体开发平台领域,字节跳动推出了“扣子”,它成为字节跳动构建AI底层基础开发生态的关键组成部分。扣子于2024年2月正式上线,无论用户是否具备编程基础,都可以通过可视化配置,在扣子平台上快速搭建基于大模型的各种AI Bot。作为连接大模型和用户使用场景的桥梁,扣子目前提供多种配置能力,包括插件、知识库和数据库等。用户可根据个人需求,在扣子平台创建个性化的AI Bot,来解决具体的问题。AI Bot创建完成后,用户还可以将其发布到公域的社交媒体平台,从而让更多用户能够使用这些AI Bot。

通过对扣子平台的体验,我们发现它不仅仅是一个AI应用开发平台,更是一个激发用户创造力工具。在扣子平台上,用户可以发挥想象力,创建全新的AI Bot,探索更多虚拟世界中的可能性。然而,要创建一个能解决复杂场景问题的AI Bot,用户需要具备一定产品思维,按照操作步骤设置和多次调试才行。我们期待扣子在未来能够进一步优化用户体验,在界面设计、个性化配置等方面进行更多升级,从而借助AI能力更好地满足用户的多样化需求。

3


B端开拓:

火山引擎全栈AI服务,

助力企业智能化转型

豆包大模型在B端的市场开拓是通过火山引擎来为企业客户提供服务的。目前,火山引擎已经与汽车、智能终端、零售等多个行业客户展开合作,共同探索行业解决方案。

应用落地面临的挑战及应对策略

在推动大模型应用落地的过程中,火山引擎主要面临三大挑战。一是由于火山引擎在B端市场经营时间较短、经验相对不足,导致其竞争力相对较弱;二是火山引擎在B端市场的优质客户资源相对有限;三是面对大模型研发的高昂成本投入和商业营收上的压力。

面对豆包大模型在应用落地过程中的挑战,火山引擎制定了相应的策略来积极应对。策略一,不断优化模型效果,将云服务和大模型进行资源整合,持续增强火山引擎的核心竞争力。在模型效果层面,豆包大模型经过不断迭代,以及大规模的调用测试,已经达到了业界领先的水平。火山引擎将云服务技术与豆包大模型深度融合,为客户提供一站式的AI解决方案,确保模型能力的高效落地。此外,火山引擎还推出了火山方舟2.0平台,提供升级版本的联网插件、内容插件及知识库插件,助力企业实现应用落地。同时,火山引擎也推出了扣子专业版,提供企业级AI应用开发平台,满足企业客户对个性化配置能力的需求。


火山引擎大模型生态


策略二,积极寻找配合度高且行业适配性强的客户群体。在豆包大模型发布后,火山引擎特别针对已有的云服务合作伙伴展开重点合作,邀请积极响应的客户参与到模型的测试和共创中。此外,根据大模型落地的适配场景,火山引擎发现汽车、智能终端、零售等行业天然具备较高的契合度。因此,火山引擎正在积极探索这些行业的落地解决方案,与行业内的客户进行深入调研,并确认合作意向,不断扩大自身的客户基础。

策略三,降低模型合作门槛,吸引更多客户合作,从而增加营收。在推理成本层面,豆包主力模型在企业市场中的定价设定为0.0008元/千Tokens,比行业平均水平低99.3%。这一大幅度的成本降低,将助力更多企业以更少的投入加速业务创新的步伐。豆包大模型的合作模式呈现多样化,如大模型API的接入、根据特定需求定制化开发、行业解决方案的合作等。在计费方式上,豆包大模型提供了预付费和后付费两种灵活的选择。这种多样化的合作模式和计费体系为不同需求的企业提供个性化的选择,有助于鼓励客户初次尝试使用大模型。客户一旦体验到模型良好的落地效果,可能会逐渐增加对模型的使用需求,从而达成更深入的合作,进一步增强火山引擎大模型的盈利能力。

通过这些策略的实施,豆包大模型迅速进入了价值创造阶段,增强了火山引擎在B端市场的竞争力。同时,这些策略的落实也为企业客户提供了更全面、更高效的服务,助力其实现AI应用顺利落地。

行业应用落地案例解析

目前,火山引擎已经与汽车、智能终端、零售等行业展开了深入合作。

在汽车行业,火山引擎与智己汽车合作,升级智能座舱产品,打造个性化驾驶体验。AI等数智化技术正在不断变革智能汽车的智能座舱产品。

2024年4月的北京国际车展上,智己汽车携手火山引擎升级智能座舱产品,并在其全新车型“超级智能轿车”智己L6推出了重磅功能City Drive。该功能全面接入了车鱼视听应用的海量资源,结合先进的大模型算法与位置信息服务,根据用户的个性化喜好,实时筛选并推送特色美食、热门景点、文化地标等本地生活内容。


智己L6上线City Drive功能界面展示


同时,火山引擎还为智己汽车提供车载影像创作方案。结合这一方案,智己 L6推出了多视角Carlog功能,能够实时调用车身四路摄像头,精准捕捉旅途中最美的镜头角度。该功能借助先进的大模型技术主动感知,并与云端AI模版剪辑相融合,为用户留住旅途“高光时刻”。最终,AI算法能够自动完成画面选取,并自动生成富有艺术感的视频作品,并能无缝流转到用户的手机相册,方便用户分享旅途中的快乐。

在智能终端领域,火山引擎联合OPPO推出多样化AI智能体,为手机用户带来全新体验。此次合作中,火山引擎为OPPO提供了豆包通用模型pro、豆包通用模型lite、豆包角色扮演模型以及大模型实时联网检索等多项先进技术。

火山引擎与OPPO的智能助手小布团队紧密配合,首先对智能助手小布进行了升级,优化用户使用体验,使它能够为用户提供更加综合的信息服务。例如,当用户向小布咨询问题时,小布助手能迅速理解用户的提问,准确判断用户需求,并即时给出回答。此外,火山引擎与智能助手小布团队合作,创新推出4个AI智能体应用:“小晴”智能体,“文锋”智能体,AI 面试官智能体和AI 英语老师智能体,在特定的领域内为用户提供专业性服务。目前,这些智能体应用已逐步在OPPO Find X7、一加Ace等热门机型上搭载并投入使用,丰富了手机的交互功能,显著提升了OPPO手机在市场上的核心竞争力。

在零售行业,火山引擎与海底捞合作上线用户评价分析系统,致力于为用户提供优质的服务体验,提升顾客服务满意度。

当顾客享用完海底捞火锅后,在平台上留下评价时,这些信息会被豆包大模型精准地提取并进行分析。无论是食材的新鲜程度、服务的态度还是店铺的环境等多方面反馈,豆包大模型都能准确捕捉,并对其进行细致分类,最终生成一份详尽的服务质量报告。通过这份报告,海底捞能迅速掌握顾客的需求和反馈,及时调整服务策略,提供更优质的用餐体验,从而提升顾客满意度。同时,这套用户评价分析系统的使用,提高了顾客反馈信息处理的效率,有效降低了人工成本。

通过上述案例的分析,我们发现火山引擎主要依托豆包大模型的能力,在B端市场为企业客户提供智能化的解决方案。这些方案的落地,不仅帮助企业实现智能化转型,还进一步推动了企业客户业务的增长,同时也促进了火山引擎自身业务的发展。

4


结语

字节跳动在AI产品应用和落地方面成果显著。在C端,字节跳动推出了一系列AI产品应用,覆盖AI智能助手、AI创作、AI社交、AI智能开发平台等关键领域。在B端,字节跳动通过火山引擎与企业客户合作,利用豆包大模型为企业提供一站式的AI解决方案。火山引擎已经在多个行业实现了AI应用落地,能够将AI技术深度融入客户的业务流程中,助力企业实现业务转型和业务创新。

随着生成式AI技术的不断进步和广泛应用,字节跳动将迎来更多新的机遇与挑战。我们期待字节跳动在AI时代继续引领技术创新,拓展更多应用场景,为普通用户和企业客户提供更加个性化、智能化的产品和服务。


更多深度好文


点击下方文章标题,立即阅读最新行业热点、业界趋势

视点 | 大模型之三观

视点 | 中国式大模型,产业实用主义

案例 | 华为云盘古大模型:走难而正确的道路

案例 | 百度生成式AI:头雁早飞鸣秋丰

案例 | 科大讯飞:大模型商业化应用元年的下一步



购买最新杂志


长按下方卡片识别二维码,购买最新杂志



关于我们


本文编辑:王佳梁

本微信号由中国传媒大学广告学院《媒介》杂志独家运营

版权所有,违者必究


点击下方卡片,关注公众号,第一时间获得最新深度资讯

媒介杂志
整合传播传统及新媒介资讯,分析行业热点事件,探索业界趋势
 最新文章