好用的工具与技术突破一样重要。
11 月 12 日,百度举办世界大会,展示了大模型落地的另一个侧面——大规模应用到产业中。百度创始人、CEO 李彦宏说,过去一年半,他看到金融、能源、教育、招聘、公共服务等各个领域,“大模型跟场景结合后,在降本和增效两个方面都取得了实实在在的成果”。
比如拥有肯德基、必胜客等品牌的百胜中国,在全线业务中应用百度的客服产品和解决方案,大模型每天调用量的峰值达到数百万,每天 AI 客服能够处理超过 15 万次客服沟通任务,问题解决率高达 90%。智联招聘则是与百度合作,用大模型技术改进求职者和岗位的匹配环节,人岗匹配平均准确率达到 93%。
在百度集团执行副总裁、百度智能云事业群总裁沈抖看来,AI 应用正率先在 B 端爆发,而 “企业级”AI 应用大量涌现的背后,是产品服务形态的突破性变革与能力的大幅拉升。此前企业客户开发 AI 应用,想要在行业场景中达到更专业的效果,需要深入到模型层,往往投入数月甚至更久,去定制开发一系列行业模型或者场景模型。
而大模型更通用,几乎只用一个模型,就能解决原本需要多个模型才能解决的问题,只需要一小部分资源和几天时间,客户就可以在特定业务场景中落地,获得更好的效果。
凭借过去多年推动 AI 落地的经验、AI 技术方向的投入,在这一轮大模型技术变革在 2023 年前后到来时,百度智能云结合文心一言等基础模型推出了千帆大模型平台等工具,开始加速探索推动大模型在产业中规模落地。
李彦宏说,一半以上的央国企以及很多的民营企业,都在联合百度智能云进行 AI 创新。截至 11 月初,百度文心大模型的日均调用量已经超过 15 亿,相较一年前首次披露的 5000 万次,增长约 30 倍。他说,“百度智能云已经拥有中国最大的大模型产业落地规模。”
大模型在产业中规模落地,正在成为百度智能云收入和利润增长的动力。今年二季度,百度智能云收入达 51 亿元,同比增长 14%——增速是去年同期的 2.8 倍,利润率也在上升。其中一个重要因素,百度智能云业务中,AI 贡献的收入占比从上季度的 6.9% 提升到 9%。
在百度世界大会上,李彦宏发布覆盖金融、能源、教育、招聘、公共服务等众多行业的大模型 100 大产业应用;在具体的场景中,百度智能云也推出了新方案,如全新升级的 “文生 3D 数字人视频” 功能,称可以提升电商、教育、文旅等行业的内容创作、营销推广效率,大幅降低成本支出等,希望吸引更多客户使用百度智能云。
百度智能云成立 9 年,做了 9 年 AI
百度云计算业务从 2015 年正式对外运营,后来更名为 “百度智能云”,一直有个鲜明标签:AI。
这个标签直接来自百度长期投入研发 AI。2013 年,百度在美国建立深度学习研究院,一直投入至今。在此期间,百度用 AI 技术改造搜索等原有业务、开辟了无人驾驶等业务的同时,也通过云计算平台把 AI 技术对外开放。后来百度云提出了 “云智一体” 的战略,并将其视为在云计算领域差异化竞争的支点。
2020 年 7 月,李彦宏参加世界人工智能大会说,“百度将自己定位于专注对外赋能的 AI 平台型公司”,他希望每一家企业都可以像用水和电一样使用百度的平台能力和服务,快速实现 AI 化转型。
根据市场调研机构 IDC 统计,截至 2023 年,百度智能云在中国 AI 公有云市场的份额连续 5 年保持第一。多年摸爬滚打,百度智能云积累了一批愿意尝试用 AI 技术改造业务的客户,和 AI 在产业中落地的经验。
对于云计算公司来说,客户和服务经验都是优质资产。在客户层面,一旦某个企业选定公有云服务商,都会在数据和业务层面深入绑定,迁移成本会持续升高。所以在新技术到来时,这些客户往往会愿意在原有的云计算平台上继续探索。
百胜中国与百度的合作始于 2021 年。早期百胜中国主要利用百度的技术服务,辅助确定数千家新增门店的选址,提高了选址质量和效率。等到百胜中国尝试把大模型技术用到业务中时,百度智能云就成了首选合作对象之一。
“创新不是闭门造车。”2023 年初的百度 Create AI 开发者大会上,李彦宏谈到了对创新的看法,“创新,是你有机会进入市场,不断获得用户和客户的反馈,摸着 ‘反馈’ 过河才能实现的。”
大模型在产业中落地早期,客户反馈非常关键。大模型相当于锤子,但怎么在实际使用中,高效地把钉子钉好,还需要技术供应商和客户一起磨合。百胜中国这些愿意尝试探索的客户,会给百度智能云的大模型方案提供反馈,帮助他们根据真实的需求快速迭代。
好用的工具与技术突破一样重要
与传统的计算设施相比,云计算的明显变化之一是,客户不用买服务器,只需要按需调用云计算平台上的计算资源。调用基础设施门槛低,也是云计算渗透率不断提高的原因之一。
但大模型这种相对前沿的技术,与之前企业在云计算平台上使用的技术有明显变化。云计算公司想要获得客户,只有行业领先的基础模型还不够。
OpenAI 开发出了行业领先的基础模型,同样对外提供模型服务,但还是有大量企业选择去微软 Azure 调用 OpenAI 的模型。二者的差别之一,就是微软 Azure 有成熟、易用的工具,能让企业用好大模型。
“如果把大模型比作马,那工具就是马鞍。” 百度智能云技术委员会主席孙珂说,“只有用上马鞍的马,才能跑得稳、跑得快。”
2023 年 3 月,百度发布对标 ChatGPT 背后模型的文心一言时,就同步推出了企业级大模型生产平台 “百度智能云千帆大模型平台”,主要的作用就是帮企业客户精调、部署大模型应用。到今年 9 月,百度智能云把千帆平台更新到 3.0 版本,提供覆盖模型开发、模型服务再到应用开发的全流程工具。
百度云更新工具链的速度还在不断加快。百度世界大会上,沈抖又介绍了千帆的新功能,比如千帆的模型蒸馏解决方案的一个示例:用大型的基础模型 ERNIE 4.0 Turbo 萃取训练数据,然后通过数据筛选、洞察和处理制作成精调数据集,精调轻量的大模型 ERNIE Lite。
“(在特定的场景)蒸馏后的模型,只用 ERNIE 4.0 Turbo 模型 10% 的成本,效果基本与旗舰模型持平,速度也更快了。” 沈抖说,“大模型应用上线后,企业还能用千帆处理应用中产生的数据反馈给模型,持续优化模型效果。”
百度内部的业务也用千帆平台探索大模型应用落地,并更快地提供反馈,帮助百度智能云优化工具。
与此同时,百度智能云也在持续更新最基础的计算平台百舸。一方面,百度智能云提高算力网络上限。根据沈抖介绍,当前百舸已具备了成熟的 10 万卡集群部署和管理能力,为百度和客户训练基础模型提供支持。另一方面,百度智能云也持续优化大模型的算力消耗,降低客户调用大模型的成本,与千帆等工具一起,推动大模型应用规模落地。
Agent 是大模型重要发展方向,也是云平台的机会
今年 9 月,李彦宏在内部演讲中说,Agent(智能体)提供了一种非常直接、高效、简单开发大模型应用的方式。
在他看来,Agent 是大模型最重要的发展方向,随着基础模型的日益强大,开发 Agent 会越来越简单,只要用 “人话” 把工作流说清楚,再配以专有知识库,就可以做出一个很有价值的 Agent 。
基于这个判断,百度智能云在世界大会上推出了新工具:工作流 Agent。这是沈抖在演讲中提到的第一个产品。
他举了一个销售保险的案例:售前阶段,哪怕推销一个再简单的产品,也涉及客户需求探查、产品介绍、价格谈判这些复杂的流程。过去没看到哪一家企业能放心把售前销售交给 AI,因为 AI 很难应对这种复杂的流程,现在借助工作流 Agent 中多轮对话编排功能,就有了挑战这个难题的可能性。
沈抖展示工作流 Agent 在保险场景的应用示例。
百度智能云智能客服与智能内容产品部总经理张红光在一场访谈中说,大模型让 AI 应用能力提升的同时,也带动了应用开发基础设施的变化。原本开发智能客服产品,仅理解用户说了什么这个环节,他们就要开发数款模型,有的专门用来分词,有的专门用来理解语意,有的专门用来理解情绪等,现在只用一个基础模型就可以解决。
引入大模型后,应用开发过程的确变简单了,但基础模型的开发门槛也变得更高——训练一款性能领先的基础模型,成本将达到数亿,甚至数十亿元人民币。这已经超出了大多数公司的技术投资上限。对于它们来说,最划算的方式是通过公有云平台直接调用训练好的模型。
云平台想要抓住这个机会,只有效果领先的基础模型还不够,还需要提供整套的应用开发工具。在云计算领域,从基础设施服务出发,链条越长,也就意味着更多利润空间,比如 IaaS(基础设施即服务)利润率普遍维持在 5%~10%,而云平台投入更多资源的 PaaS(平台即服务)提高到 50%,SaaS(应用即服务) 能到 70%。
大模型应用的开发方法,也能让云计算平台避开定制开发陷阱。这是此前中国云计算公司拿下传统企业订单的主要方法——投入大量人力和资源,针对企业特定场景定制开发模型和解决方案。但定制开发的成果大多还不能复用到其他企业中,因此亏损成为常态。而开发大模型应用,则是用标准化的基础模型和工具,解决不同企业、不同行业场景差异化的需求。
从百度世界大会的展示来看,凭借着过去的技术投入和工具开发,百度智能云在推动大模型在产业中规模落地有了一部分成果。
题图来源:百度世界大会
· FIN ·