让大模型超级有用，李彦宏放了个大招

财富 2024-11-14 13:50 江苏

“过去这24个月，这种全球性的大模型狂热，究竟是一场新的技术革命，还是新一轮泡沫？”

11月12日的百度世界大会上，以标志性白衬衫现身的百度集团创始人兼CEO李彦宏在他的演讲开头，就向外界抛出了这一重磅的“大模型之问”。

AI究竟是不是泡沫？

李彦宏和百度对这一“大模型之问”的回答显然很坚定——AI不是泡沫，文心大模型调用量的高速增长印证了这一点。

截至目前，百度文心大模型的日均调用量已超15亿次，相较一年前首次披露的5000万次，增长约30倍，这说明AI是真需求，大模型应用正处于爆发前夜。

李彦宏和百度没有满足于此。在刚刚结束的百度世界大会上，百度发布了最新的检索增强的文生图技术（iRAG）和无代码工具“秒哒”。

未来已来，人们与“AI应用创造世界的距离”，又近了一步。

“我们不是要推出一个‘超级应用’，而是要不断地帮助更多人、更多企业打造出数以百万‘超级有用’的应用。”

在此次百度世界大会上，李彦宏率先在行业里喊话——“要打造超级有用的应用”的原因所在。

iRAG技术和无代码工具“秒哒”，其实是百度为“加速应用渗透”送上的锤子。

想让大模型落地直接应用、产生实用价值，国内外大模型厂商其中的一个主线任务，就是各出奇招解决大模型的“幻觉问题”。

李彦宏认为，过去24个月，大模型的最大变化是基本消除了“幻觉”，这主要得益于RAG（检索增强生成）等技术对模型性能等提升。

RAG技术结合了信息检索和生成的能力，有效提高了大模型文本内容生成的质量，但随着图像等多模态AI的飞速发展，大模型的“幻觉”问题变得越来越复杂，各类文生图模型尽管反复宣称在生成效果上“超越人类设计师”，但在实际使用过程中，用户的翻车体验并不在少数。

在AI生图领域，怎么杀死“幻觉”？关键时刻，还是百度带来了好消息。

据百度CTO王海峰介绍，在今年年初，百度就决定下场通过自研iRAG技术，结合不同应用场景下用户具体的生图需求，解决图像生成的幻觉问题。

王海峰具体介绍了iRAG实现可控生图的技术链路，和此前百度的检索增强技术类似，这依旧是一个“理解-检索-生成”协同优化的过程。

首先，大模型会用户的具体需求进行分析理解，自动规划精确或者泛化的方案，比如对哪些实体进行增强；

其次，在增强阶段，对需要增强的实体进行检索，并选择对应的参考图；

最后，在生成阶段，百度自研了多模态可控生图大模型，一方面，通过局部注意力计算，大模型能在保持实体特征不变的情况下，实现图像的高泛化生成；另一方面，通过整体注意力计算，可实现图像的高精确生成，保持生成图和原图相关物体等元素的一致性。

「财经无忌」以“锤子手机”、“虎皮鸡蛋”等prompt，实测文心一言AI生图功能发现，对比国内其他模型厂商，在iRAG技术加持下，所生成的图片对prompt的理解更准确，图片的生成质量也不错。

左图为其他厂商，右图为文心一言

以人物动作和环境的一致性，我们以“生成一张在玩手机的华妃的图”为需求，也“考了考”文心一言的表现，不到20s文心一言就完成了任务，所生成的图片也与真实世界高度相似，没有什么“AI味儿”。

对prompt的理解、人物一致性、

生成速度都超出我们预期

iRAG技术无幻觉、超真实、低成本、立等可取等一系列优势，这也意味着，小到普通自媒体工作者的图文编辑，大到上市公司宣传海报制作，都有望直接从中受益，AI应用的空间也得以打开。

李彦宏在接受媒体专访时也提到：“多模态要想进入真正实用阶段，也得有准确性，或者说可控性。让你不变就不能变。有了这种能力后，应用空间才能打开”。

除了消除大模型的幻觉，是AI应用爆发的技术前置条件，更关键的是还有找到大模型时代应用落地的载体。

百度瞄准的方向就是就是智能体。

今天，智能体几乎已成为头部大模型厂商探索的“标配”。

麦肯锡报告显示，过去的一年里，Google、OpenAI都将智能体作为大模型最重要的应用场景，OpenAI创始人奥特曼近期采访中提及「5级AGI」蓝图里也反复强调“智能体”的作用：“第三级是智能体，能够执行长期任务，比如与环境多次互动，并与人类协同工作”。

李彦宏认为，智能体相当于 PC 时代的网站和自媒体时代的账号，其特点是门槛低、天花板又足够高。

本质上，智能体是一个更轻量化、更具主动性和更强交互性的AI应用，但对一个毫无编程经验的普通人来说，想要创造一个专属智能体或实现多智能体的协作，依旧有很高的门槛。

而百度的无代码工具“秒哒”的诞生，解决了这一问题，用户只需要向大模型表达出自己所需要的智能体工作流等信息，仅依靠自然语言交互，就可以完成一整套系统的设计、开发、测试。

区别于其他的低代码或无代码开发平台，“秒哒”的特色有两点：一是不局限在程序员等开发者，门槛更低。二是整个应用的开发过程，可实现多智能体的协作。

据王海峰透露，这主要是因为“秒哒”所采用的是智能体的“中心化模式”。

举例来说，如果用户想针对某新技术发布会开发一个嘉宾邀请和管理系统，“秒哒”在受到需求后，“小组长智能体（0号智能体）”进行规划调度，将任务拆解并召唤各智能体来完成任务，策划设计方案会交给“策划智能体”，文字编辑内容会交给“编辑智能体”，网页的代码编写、系统制作和部署由“程序员智能体”完成，最后还有负责质检的智能体，检查和测试代码，并能和其他智能体配合一起改bug。

总结来看， iRAG技术进一步解决大模型的“幻觉”，“秒哒”则是以低门槛的方式让小白轻松上手应用开发，为「超级有用」铺路造桥的百度，其实也为应用爆发打好了基础。

“国外有一种说法叫‘软件吞噬世界’。但我认为，这个世界不应该被吞噬，而应该被创造。AI时代，应用创造世界。”

在漫长的科技史上，对新技术的质疑，从来都不是什么新鲜话题。

那些“AI泡沫论”的拥趸者，所给出的理由是：“至今未出现一个大模型时代的超级应用”。

这实际陷入了一个“应用误区”——对“超级应用的过度迷恋”。过去两年里，市场涌现出诸多号称“大模型时代的超级应用”，但又迅速衰落，根本原因在于“好看但不有用”，难以与个人、企业的实际场景和需求结合，形成产品迭代的增长飞轮，自然也难以长红。

“如果说2023年大家还在卷模型，让模型能力逐步地达到可用地步的话，那未来所谓的‘可用’，就是真的有东西用。”李彦宏说。

“超级应用”到“超级有用”，一字之差，所对应的是两种完全不同的认知和实践逻辑。

一方面，在认知上强调“有用”更偏向谈生成式AI的落地价值，而不是“为了创新而创新”；另一方面，在实践上强调“有用”是关注用户和企业的实际需求，避免“拿着锤子找钉子”。

在“超级有用”的思路下，再看百度推出iRAG技术和无代码工具“秒哒”，其实有更深远的两重含义：

一是将真技术创新与真需求场景融合，降低普通人实践AI的门槛，打开AI应用落地的规模化空间。

无论是关注幻觉问题的iRAG技术，抑或是让零编程经验的普通人也能手搓智能体的“秒哒”，都是百度结合现有模型能力，将复杂的技术场景留给自己，将最简单的体验留给用户，缩短人们与AI间的距离。

二是在瞬息万变的技术发展中为更多人找到可确定的方法论。在GPT-5迟迟未至，Scaling law放缓的诸多质疑中，李彦宏认为，这对应用层来说是反而是新机遇。

“从应用端来看，技术进步的速度不仅没有放慢，甚至有变快趋势。从另外一个角度来讲，反而是基础模型不能够特别快的迭代，如果老在变，那做应用的人就无所适从了。”

当然，长期来看，在复杂的应用场景里，模型能力的提升依旧还会遵循大力出奇迹的Scaling law或依赖模型精调、数据标注等工程化手段，但在一些相对没有那么复杂的应用场景里，比如代码领域，人们可以借助大模型能力，提升认知、创造价值，这是确定性的趋势。

“我今天能够写两百行代码，一年以后可能能写两千行代码，再过三年可以写两万行代码，这个能力会逐步发展出来，那它会让更多人的创造性给激发出来。”李彦宏说。

而当更多人看见AI产生的实际价值，大模型或许也能从“智能涌现”、“能力涌现”再到最终实现“价值涌现”。

伴随AI成果的涌现，人们也在关注中国大模型的“未来之问”：

中国大模型产业爆发能否复刻移动互联网时期的辉煌？中国AI公司与硅谷企业相比，又有哪些比较优势？

回到“第一性”原理，李彦宏认为百度就是“应用驱动”。

”美国很多公司一直都是梦想说我要做颠覆性的技术，我更多希望尽早接触场景及接触应用，看在这个过程当中，到底遇到了什么问题，把这些问题带回来，我们综合看一下，大家遇到的最多的问题，就是我们优先解决的问题。“李彦宏解释。

“应用驱动”既是百度的底层战略思考，也是中国大模型弯道超车的优势。

毕竟，从移动互联网时代开始，中国就诞生出诸多超级应用，在技术落地的终端入口上，中国同样也是全球最大的消费电子生产国、出口国和消费国。在迭代的技术革命主题背后，将技术创新与市场需求结合，落地用户端的应用，这一直都是中国厂商的优势和机遇所在。

近期，由弗若斯特沙利文发布的《2024年全球AI生态全景概览》中，百度也和 OpenAI、谷歌一起，成为了全球唯三被该机构承认的“AI 原生巨头”。

作为中国唯一一个榜上有名的公司，这份榜单恰好给出了我们答案：中国大模型弯道超车，机会就在应用驱动。

关于应用的故事，李彦宏和百度显然瞄准的是AI的长期主义，十二年前，投身AI浪潮的百度选择成为彼时AI火种的传播者时，没人能想到这场“应用来了”的浪潮或许将改变每个参与者的命运。

现在，他们继续沿着这条路行走，李彦宏将人工智能比喻成“一次新的工业革命”：“这意味着它不是三五年就结束，不是一两年就出现‘超级应用’的过程，它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。”

拉长科技史，无论是微软谷歌，抑或是如今的英伟达，那些将经历放在专“技术是否真的有用”的科技巨头也都收获了时间的玫瑰，或许如李彦宏所言“我们即将迎来AI应用的群星闪耀时刻”，而中国大模型，也有望借助应用驱动，讲述更多的新故事。

财经无忌

我们更懂中国商业

最新文章

九号公司又傍新大腿，这一次翻身还是翻车？

为什么说，2025年会有更多的招牌好生意诞生在淘宝？

极越汽车背后的吉利早就想这么干了

GT系列出世，荣耀剑指星辰大海

运动户外成风潮，淘天如何放大招？

让年轻人实现“品质懒”的，居然是这群厂牌

为什么说孩子王的这场全球伙伴大会，传递了行业的进化方向？

如何管理一家全球市值最高的公司｜解读黄仁勋

感恩全场之后，杨植麟还有更要紧的事

从“百模”到“千体”，智能体如何跨越“商业裂谷”？

易烊千玺同款卖爆，背后这家百年品牌又坐不住了

三季报里，小鹏汽车报喜不报忧

一杯中国咖啡，如何解锁中巴合作新增量？

从特斯拉，到小米再到雅迪，为什么车企大佬都爱打螺丝？

“松哥打虎”收割的是流量，扰乱的是民营经济

动辄上百的轻食，被肯德基“卷下来”了？

黄仁勋的「餐桌」

外资品牌市占不足5%，中国企业凭什么“统治”了这个市场

解码民生银行数字化转型：一家7万亿银行的数据能力建设样本

踏上“成长飞轮”，如何重新审视哈尔斯未来成长性？

泡泡玛特，越来越像名创优品了

龙蟠科技：全球第四也还亏钱

“红牛”迷案:契约精神比舆论战更显重要

让大模型超级有用，李彦宏放了个大招

“松鲜鲜”复制不了元气森林｜消费观察

从控温到氮氧智控，百年冰箱行业的新变局

这场100万商家观看的直播中，找到11个在淘系经营的关键词

把“国补”卷到next level的京东，治好了我的“买家电焦虑”

神州租车狂欢夜背后，是重塑出行行业的野望

80岁资本大佬被罚了养老钱

绝味食品被投资绊倒？

营收净利双增，从南京银行三季报看到“十足的后劲”

要狼性、要血性，汤臣倍健以“攻”为“首”

中国咖啡的“复利效应”，开始在瑞幸身上显现

销售额翻3倍、库存一天卖完，这届网友爱上“萌宠带货”

今年双11，淘宝出海“气候渐成”

刘润年度演讲2024：进化的力量（演讲全文）

三天两夜，我见到了万亿常州的live动图｜一线调研

多驾马车并驾齐驱，洽洽食品交出历史最好三季报

云南咖啡命运的齿轮，是被如何转动的？

“纯血鸿蒙”还有三关要过

重新理解“万亿平安”，值得一场深层价值重估

雅加达，不要温柔地走进那个良夜 | 出海观察

吃货们「追着时令吃」，餐饮商家们有了新秘籍

AI搜索战火重燃

一个你从未听说过的“神秘”南京 | 一线调研

市值腰斩200亿，益丰药房为何没有“自救”药方？

蚂蚁保的“天选代言人”，为什么是刘亦菲？

硬核助农又添新样本，官媒密集报道农夫山泉有何深意？

预售倒计时5天！如何抢赢思路只看阿里妈妈冲刺预售投资热榜

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉