在百度这场大赛上,我们看到了“AI超级应用”的影子|甲子光年

科技   2024-09-26 20:44   北京  

从网站到Agent,互联网产品的发展逻辑从未改变。


作者|王艺
编辑|栗子

1989年3月12日,工程师蒂姆·伯纳斯-李(Tim Berners-Lee)向他就职的欧洲核子研究中心(CERN)提交了关于万维网(World Wide Web,简写为WWW)的提案。提案通过后的1990年,他编写了第一个网页浏览器WorldWideWeb,运行在一台由乔布斯被赶出苹果董事会之后发布的Apple NeXT主机上,并于1991年向全球开放,万维网就此诞生。


Tim Berners-Lee当时的提案 图源:CERN网站


万维网通过超文本标记语言(HTML)简化了网页的创建和浏览,使得用户能够轻松地导航和访问信息;1993年,Mosaic浏览器诞生,它提供了图形界面、彩色文本和嵌入式图像等功能,极大地提升了用户体验;此外,随着NSFNET的商业用途限制被取消,更多的企业开始投资于互联网基础设施建设,从而增加了带宽并降低了成本。

于是,20世纪90年代迎来了“网站大爆发”。有数据统计,1993年时,全球仅有不到1000个网页,但到1997年,仅美国本土就新增了80万个新网页。这其中,有相当一部分的网页是一些大学生、甚至科技小白在万维网这一基础设施上创造出来的。

这一时期不仅诞生了雅虎、Hotmail等知名的网站,许多新兴公司如Linux、eBay、Netflix也相继成立并迅速崛起,后来更是诞生了谷歌、微软、亚马逊等市值超过万亿美金的公司,造就了互联网乃至整个经济史上难得一见的繁荣。

可以说,万维网的出现,是后来数以百万计网站和万亿美金市值互联网公司崛起的前提。产业的发展往往是由技术的变革催化的,没有简洁易用的技术底座,就没有开发者权力的下放,也就没有百花齐放、凸显个体智慧与创意的的众多网站和互联网应用的创新。

这一道理,在大模型时代同样适用。

今天的大模型,或许可以被看作是和33年前的万维网一样的技术底座。当时基于万维网,诞生了网站这一“互联网原生应用”,那基于大模型,诞生的“AI原生应用”又是什么呢?



1.智能体,最接近AI原生应用的产品形态


在「甲子光年」看来,这一问题的答案无疑是智能体(AI Agent)。

无论是去年上半年AutoGPT的爆发、斯坦福AI小镇的爆火,还是下半年GPTs的发布、智能体在搜索、电商、协同办公等产品中的应用,抑或是最新OpenAI o1模型中的Agent推理模块,Agent在AI领域的热度和关注度从未消减。

为什么Agent是最接近AI原生应用的产品形态?

要理解这个问题,首先要了解Agent的发展史。

“Agent”并不是当今的产物,而是在人工智能的发展过程中,伴随着“智能实体”概念的诞生逐步进化的结果。

有人认为AI Agent起源于20世纪80年代迈克尔·沃德里奇 (Michael Wooldridge)等人将Agent引入到人工智能;也有人认为最早的Agent概念是上世纪50年代阿兰图灵把“高度智能有机体”扩展到人工智能的结果;更有论文将最早的Agent概念追溯到了18世纪哲学家丹尼斯·狄德罗的“聪明的鹦鹉”学说。

伴随着人工智能从符号主义到联结主义的发展,AI Agent也经历了符号型智能体反应型智能体基于强化学习的智能体基于迁移学习和元学习的智能体四大发展阶段。

早年间,基于规则的符号型智能体效率较低;反应型智能体缺乏复杂决策和规划的能力;基于强化学习智能体尽管能通过与环境的交互进行学习,但是Agent的泛化性较差,往往用于非常窄的特定领域,如游戏、围棋(eg.AlphaGo)等场景。而引入迁移学习和元学习的智能体尽管能让智能体从少量样本中迅速推断出新任务的最优策略,但是当源任务和目标任务之间存在显著差异时,迁移学习的效果可能不佳。

AI Agent发展历程梳理 图源:甲子光年《中国AI Agent 行业研究报告》


而大语言模型(下文简称“LLM”)的到来,给AI Agent提供了一个突破性的技术方案:

LLM的思维链(CoT)和强大的自然语言理解能力让Agent具备了强大的学习和迁移能力,用户通过简单的prompt交互就可以创建Agent。这不仅降低了Agent的创建门槛,更是提升了Agent的理解力和泛化性,能更好地处理多种任务和上下文信息

与此同时,基于LLM构建的Agent还包括记忆、规划、行动和工具使用等组件,这些组件极大拓展了Agent能力的天花板,让Agent具备了更大的自主性和灵活性,不仅能与人类交互,更是能在彼此之间交互协作、完成更复杂的任务。斯坦福AI小镇里能正常生活、工作、社交,甚至谈恋爱的25个智能体就是典型案例。

LLM是Agent能力的增效器 图源:甲子光年《中国AI Agent 行业研究报告》


而AI原生应用,是指那些从设计和开发初期就将人工智能技术作为核心组件整合进去的产品。这类产品不仅仅是添加了一些AI功能的传统软件或服务,而是从根基上就是为AI打造的,这意味着它们的设计和架构都是为了最大化AI的能力和效果。

伴随人工智能的发展而出现、又被大模型赋予了超低制作门槛和超高能力天花板的Agent,无疑是AI原生产品的最佳形态。

在众多做大模型的公司中,百度是最早意识到这一点的公司。

在2024世界人工智能大会(WAIC 2024)期间,百度创始人、董事长兼首席执行官李彦宏就提到,智能体是一个几乎可以“放之四海而皆准”的基于大模型的应用

“我觉得智能体正在爆发,只是说它现在基数还比较小,大家的体感没有那么强烈。但是现在业界做大模型的公司,都在做智能体;今天的大多数AI原生应用,你用智能体的方式都可以做出来,效果也不错。可能你连编程都不用,就可以做出一个效果不错的智能体”李彦宏说。

在今年6月“亚布力成长计划-走进百度”的活动中李彦宏更是提出,由于门槛足够低、任何人都有能力参与和创建,因此智能体就像AI时代的网站,未来将形成涉及各行各业、覆盖数百万量级的庞大生态

“我们认为未来各行各业、各个领域都会依据自己具体的场景,根据自己特有的经验、规则、数据等等,去做出来智能体,就像互联网时代的网站一样,会有几百万,甚至更大量的智能体出现”,李彦宏说,“因为它门槛足够低,而背后的大模型的能力越来越强,你会发现过去解决不了的问题,现在可以解决——今天的智能体不单是只有对话能力,还有反思能力、规划能力和使用工具的能力;未来有些复杂的任务,还可以通过多智能体协作的方式来完成。”

正如李彦宏所说,我们看到行业做智能体的脚步正在加快,如今,各家大模型厂商都发布了自己的智能体产品:

飞书在去年11月发布了第一款AI Agent产品“飞书智能伙伴”;字节跳动在今年2月发布了智能体制作软件“扣子(Coze)”;智谱在今年1月发布第四代基座大模型GLM-4的同时,上线了自己的“智能体中心”;月之暗面在今年5月发布了智能体Kimi+;而华为、腾讯、科大讯飞等大厂和百川、澜码科技、面壁智能等创业公司也都发布了自己的智能体产品。

各家大模型公司推出的智能体产品 制图:甲子光年


在众多拥有智能体产品的大模型公司中,百度是为数不多拥有“构建智能体生态”能力的公司之一。

为什么智能体的“生态”如此重要?

还是要回归到底层逻辑去看问题。纵然智能体是基于AI大模型构建的,但它依然脱离不了“互联网”,依然属于互联网产品的范畴。在互联网领域。“生态”代表了一种超越传统商业模式的新型合作框架,一个由各方主体组成的健康生态系统不仅能够产生协同效应、具有更高的用户粘性;来自第三方的开放式创新也可以创建补充性的产品和服务,丰富整个平台的功能性和用户体验;同时,构建一个多方面的生态系统,公司也可以更好地分散风险,实现长久运营和可持续发展。

可以说,强大的生态系统是互联网和大模型企业最核心的竞争力之一。而百度依托于多年做搜索的积累,拥有全网最大的搜索流量入口和超8亿的用户,是最适合创建智能体的场景之一。

今年4月,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会主题演讲上发布了三大开发工具:AgentBuilder、AppBuilder、ModelBuilder,其中,AgentBuilder(文心智能体平台)是基于文心大模型的智能体构建平台,为开发者提供低成本的开发方式,支持开发者和企业根据自身行业领域,低门槛、批量化地创建智能体。其中一些智能体表现十分优异,比如百度在6月推出的高考智能体,可满足不同考生的个性化需求,帮助他们选择大学和专业。高考后,该智能体的日活跃用户峰值接近200万。

百度官方数据显示,目前已有60多万开发者和超10万家企业入驻文心智能体平台,覆盖了100多个应用场景。其中一些企业的探索已经走在了前面,诸如启德教育、索菲亚、北京市盛廷律师事务所、节卡机器人、土巴兔等企业,不但在平台上创建出了自有场景的智能体,还初步试水跑通了商业模式。

而在智能体的分发上,搜索显然也是一个更高效的分发入口。在如今在百度搜索上,已经能看到很多智能体在上面提供内容服务,百度搜索也上线了“AI助手”频道,为企业创建的智能体打通分发渠道。数据显示,智能体在百度生态的分发量正在快速上升,7月日均分发次数超800万,为5月的两倍,最常用的智能体包括内容创作、性格测试、日程规划等类型

“百度希望与所有创业者一起,共建繁荣的AI原生应用和智能体生态,帮助创业者更早找到PMF,做出AI时代的超级应用。”在9月25日云智大会上举办的“文心杯”创业大赛致辞环节,百度创始人兼董事长、CEO 李彦宏表示。



2.用一场比赛,找到最有商业潜力的“黑马”


尽管百度率先找到了“智能体”这一最接近AI原生应用的产品形态,但是AI原生应用最终要实现爆发,还是要有正向的经济收益作为支撑。

在百度庞大的智能体生态中,谁是最有潜力实现用户量爆发和商业化营收的“黑马”?

——是骡子是马拉出来遛遛,比场赛就知道了。

2023年,百度举办了首季“文心杯”创业大赛,总计近千支创业团队报名参赛,最终有15支团队脱颖而出,合计获得百度的数千万元投资和生态支持。而今年四月,百度发起了“文心杯”创业大赛·第二季。本季创业大赛扩大了项目筛选范围,加大了对创业者的支持力度,提供更充足的投资资金、更丰富的业务资源。

“文心杯”创业大赛第二季现场 图源:百度


相比去年的第一季大赛,今年的“文心杯”创业大赛参赛规模持续提升,应用层参赛项目占比进一步提高,创业者的创业方向也愈发多元:本届「文心杯」吸引了近1600个项目报名,远超去年的近千规模;应用层参赛项目比例从去年的8成提升至今年的超9成;去年有约30%的参赛项目聚集在通用办公及营销领域,而今年参赛方向百花齐放,涵盖文娱、电商、营销、医疗、办公、硬件、企业服务等。此外,今年的大模型应用创业团队也呈现出了明显的“年轻化”、“精英化”和“小团队”特征。

值得一提的是,在本届文心杯的参赛团队中,超过60%的参赛团队聚焦智能体应用,超过30%的参赛团队没有专业程序员。

9月25日,百度“文心杯”创业大赛·第二季结果正式揭晓。经过内外部专家的层层评审选拔,8支优秀创企组团队最终获得百度数千万的现金+资源投资,而高校组也有13个项目获奖。

创企组的8个获奖项目分别是:一站式电商素材AI工具极睿科技、虚拟角色社交互动平台Kotoko、AI漫画平台水母智能、基于全科教育大模型的引导式AI Tutor师者AI、基于大模型的专业心理诊疗AI智能体镜象科技、AI-Native金融投研工具问智科技、“AI+设计”应用软件亦心科技、私域社媒运营AI Agent LightAI

高校组的13个获奖项目则包括:AI建筑业安全助理Besafe、AI生成3D/4D内容Aiuni AI、电网式算力调度平台共绩科技、AI电商虚拟试衣及服装展示视频生成平台VidFit.ai、AI电影制作平台Film Action、新一代具身智能端云脑奥兹智能、基于AI Agent技术的影片剪辑工具Zonic AI、依托MoE端云融合大模型的健康管家Agents医者AI、AI驱动自我提升-虚拟世界情感映射引擎谓尔、AI Agent众智开发平台AlignX、AI升学智能助手智面、Z世代AI游戏化社交平台好捏、基于位置服务的社区社交平台方圆问问

在创企组的8个获奖项目中,镜象科技2019年就上线了“AI聊天机器人”,推出了“AI测评师”、“AI倾诉师”等产品,是国内较早用利用AI做心理咨询和治疗的公司之一。ChatGPT掀起大模型的浪潮之后,镜象科技用大模型技术重构了自己的产品,推出了“AI测评师”、“AI倾诉师”、“AI心理师”、“AI疗愈师”、“AI心理工作助手”等智能体。其中,AI测评师采用多模态技术模拟医生和用户的访谈,AI医生能根据用户的眼动、表情等信号,结合用户访谈的内容,给出疾病的评估建议;AI倾诉师则基于过去积累的海量心理咨询语料,通过问答、聊天的形式给一些寻求情感支持和陪伴的用户提供服务。

镜象科技智能体产品“AI测评师” 图源:镜象科技


镜象科技智能体产品“AI倾诉师” 图源:镜象科技


不只是这些智能体,今年,镜象科技还推出了“AI临床大模型”和“AI婚恋心理大模型”,这两个模型是在包括文心大模型等多个模型的基础上训练出来的,文心大模型不仅能在恋爱问题上生成更幽默、更有情绪张力的回复,其极具性价比的定价也帮助镜象科技降低了大模型的使用成本、提升了智能体的ROI。

在百度的搜索生态上,镜象科技也上线了“镜象心理”和“AI倾诉师”两个智能体,用户搜索“学生厌学了怎么办”“原生家庭太让我抑郁了怎么办”等心理问题时,这两个智能体就会被调用。其提供的丰富、权威的回答不仅提升了百度大搜的点击率,也增加了用户停留时间,为百度的智能体生态做出了重要贡献。

极睿科技则是一家利用AI做电商图文、短视频内容的公司。在大模型时代到来之前,他们主要利用数字化的模板和传统的计算机规则做内容的生成,而2023年引入大模型之后,不仅极大增强了SaaS工具的能力、实现了内容制作的降本增效,将一条素材的价格从150-200元打到了30元,毛利率也超过了90%;而且通过在大模型上建立带货Agent,极睿科技也将自己的业务拓展到了“成交”环节,实现了每月几百万的额外营收。

可以看到,无论是通过智能体给用户做心理测评的镜象心理,还是的用AI生成电商内容的极睿科技,这些智能体和AI产品的背后,都离不开具备跨语言、跨模态、知识增强等能力的强大模型开发平台的支持。



3.智能体时代的“AI新基建”


文心大模型,就是这些智能体背后的“坚实后盾”。

文心大模型是百度自主研发的产业级知识增强大模型,包括NLP、CV、跨模态等基础大模型,对话、跨语言、搜索、信息抽取等任务大模型,生物计算等行业大模型,以及支撑大模型应用的工具平台。

自2019年发布文心大模型1.0版以来,历经四年技术深耕和研发迭代,百度已经将文心大模型升级到了4.0 Turbo版,现有的系列包含了旗舰模型文心大模型3.5和4.0、文心大模型4.0 Turbo,以及上季度推出的多款轻量级模型等。5月,百度将ERNIE Speed、ERNIE Lite和ERNIE Tiny三款轻量模型免费;7月,百度大幅降低了文心大模型3.5和4.0两款旗舰模型的价格;8月21日,文心大模型4.0 Turbo更是宣布支持模型精调,以方便企业和开发者训练出更贴合需求的大模型,提升在业务中的使用效果。

除了支持模型精调,通过数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强技术的持续创新,以及和飞桨平台的联合优化,文心大模型4.0还实现了更快的速度和更好的效果。目前,文心大模型的周均训练有效率达到98.8%,相比文心一言发布时,训练效率提升了5.1倍,推理效率提升了105倍。

文心大模型家族全景图 图源:百度


也正是基于文心大模型强大的能力,才让基于其构建的智能体具备了高度的“智能”,为用户提供价值的同时,也吸引了更多参与者的入驻,让百度的智能体生态变得更加繁荣。目前,文心大模型已大规模应用于搜索、信息流、智能音箱等产品,并通过和飞桨深度学习开源开放平台合作,赋能了包括工业、能源、金融、通信、媒体、教育在内的各行各业。

此外,AI应用创业者通过千帆大模型平台,可以应用上包括千帆大模型在内的全球主流大模型的能力。前文我们提到,百度在今年4月的开发者大会上推出了AgentBuilder、AppBuilder、ModelBuilder三个开发工具,其中,AgentBuilder是依托文心大模型构建的,而千帆AppBuilder、千帆ModelBuilder则是千帆大模型平台的两大重要工具。

其中,千帆ModelBuilder可以帮助企业高效精调专有模型。千帆AppBuilder则是一个产业级的AI原生应用开发平台,支持企业和开发者开发包括智能体在内的各种AI原生应用。

在 “百度云智大会”上,百度智能云发布了全新升级的千帆大模型平台3.0。在模型开发方面,对于需要定制、微调专属模型的客户,千帆3.0不仅提供了最完善的大模型工具链,还支持CV、NLP、语音等传统模型的开发,并实现数据、模型、算力等资源的统一纳管和调度,为企业提供一站式的大、小模型开发服务。

在应用开发方面,针对企业落地大模型的高频应用场景,千帆3.0从检索效果、检索性能、存储扩展、调配灵活性四个方面对企业级检索增强生成(RAG)进行了全面升级;针对企业级Agent的开发,千帆3.0则增加了业务自主编排、人工编排、知识注入、记忆能力以及百度搜索等80多个官方组件支持。

千帆平台大模型工具链 图源:百度


由基础组件、高级组件共同支撑的Agent可以通过工作流编排实现更为复杂的业务逻辑,并具备强大的自主任务规划的能力。以极睿科技为例,针对货架电商品牌素材更新快、制作效率低、效果差的痛点,他们推出了高度自动化的智能体,用户仅需上传图片并选择模板,智能体就会自动抓取和裁剪资源图、完成色块展示、面料说明、吊牌图制作、智能拼图、尺码替换和自动套版等工作,完成主图的制作,并批量生成详情页;

极睿科技-货架电商智能体 图源:极睿科技


而针对兴趣内容平台流量低、直播运营成本高、效果差的痛点,极睿科技的智能体则能完成自动抓取商品卖点片段、去除营销贴片、素材混剪、添加音乐和字幕等工作,品牌方无需提供直播推流的地址,只需指定目标剪辑商品与视频配置要求,即可一边直播一边实时获取海量短视频素材,降低了50%以上的视频切片制作成本。

极睿科技-直播电商智能体 图源:极睿科技


文心杯的另一个获奖项目“水母智能”同样不例外。水母智能原本聚焦AI设计领域,在成立的前两年,他们先是推出了智能LOGO、智能包装等产品;2023年3月,水母智能全面转型AI漫画赛道,上线了全国首个AI漫画创作工具“触手AI”。普通用户可以用触手AI一键写故事/改写/续写、一键生成漫画;针对那些具有商业漫画交付能力的专业用户,水母智能还提供了专业版的AI Native一体化工作台,可以满足商业级AI漫画创作者的诉求,出图效率更高。

触手AI绘画 图源:水母智能


基于文心大模型和千帆大模型开发平台,水母智能用AI重塑了工作流——比如他们面向专业用户推出了高级训练工具,使用该工具训练角色之后,该角色模型就会在创作者之间流转,从而保障人物角色的一致性。AI Native的工作流帮助水母智能降低了50%的决策时间和工作环节(岗位角色从7个变成4个,环节从11个变成5个),商业测试周期降低了89%(从28周变成3周),成本降低了62%(从72万变成28万),过去培养一个漫画助理要五到七年,现在社区里面培养一个AI native的漫画师只需要一个多月。

得益于坚实的用户基础,以及文心大模型建立起来的庞大生态,文心大模型如今的调用量超过 7 亿次,累计帮助用户精调了 3 万个大模型、开发出 70 多万个企业级应用。百度文心大模型已经成为了最适合AI原生应用生长的肥沃土壤、是创业者、开发者和客户最好的合作伙伴。

从工程师威廉·默多克(William Murdoch)发明更为先进的“行星齿轮”传统系统让蒸汽机成为真正通用的动力机、进入工厂带动各种机器的运转,到蒂姆·伯纳斯-李(Tim Berners-Lee)发明万维网、让互联网最终走入千家万户,技术的进步永远是应用发展、最终形成生态的必要条件,而AI原生应用同样如此——只有足够好用、易用的技术底座,才能让更多人拥有制作智能体、开发AI原生应用的可能性,才能创造出真正有价值且受欢迎的AI原生应用,促进人工智能产业和数字经济的繁荣。

而百度,正在这条路上不断努力着。从搜索基础设施、到云服务、再到文心大模型,百度一直在不遗余力地为行业提供技术支持与解决方案,也助力了众多企业与开发者实现数字化转型与智能化升级。我们有理由相信,未来的“AI新基建”将由百度引领,下一个AI原生应用的篇章,也将由百度书写。

(封面图来源:百度)




END.






甲子光年
甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。
 最新文章