“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”
11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码技术“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。
截至11月初,百度文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。李彦宏表示“这个增速超出预期”,说明AI是真需求。他感慨,这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。
在AI应用的发展趋势上,李彦宏表示,智能体是AI应用的最主流形态,即将迎来爆发点。他依次讲解了公司、角色、工具和行业四大类智能体,将做智能体类比为PC时代做网站、或是移动时代做自媒体账号,“不同之处是智能体更像人、更智能,更像你的销售、客服和助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
演讲中,李彦宏还展示了文心智能体平台TOP100智能体和TOP100产业应用,并表明 “百度不是要推出一个‘超级应用’,是要帮助更多人、更多企业打造出数百万‘超级有用’的应用”。当天发布的无代码工具“秒哒”,具备无代码编程、多智能体协作和多工具调用三大特性,用自然语言就能搭建一整套系统,将开启一个“只靠想法就能赚钱的时代”。
解决图片生成幻觉 文心iRAG发布
幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是RAG,即检索增强。
回顾过去两年,李彦宏认为,检索增强生成(RAG)从百度特色,逐渐发展成为了行业共识。目前,文字层面的RAG已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。
目前,基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。
针对上述问题,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,“整体效果远远超过文生图原生系统,去除了机器味儿”。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。同时展示的“爱因斯坦环游世界”图片中,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片。
iRAG技术极大地提高了AI生成图片的可用性。比如在品牌宣传上,以前拍一组海报动辄大几十万,但现在的创作成本接近于0。
简单而言,文心iRAG的商业价值体现在:无幻觉、超真实、没成本,立等可取。此外,在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。
消除大模型的幻觉,也是AI应用爆发的基础。在李彦宏看来,今天,基础大模型能力就绪,即将迎来AI应用的群星闪耀时刻。
智能体是下一个应用爆发点
“今天,全球所有顶尖科技公司都在关注智能体,但像百度这样把智能体作为最重要战略方向的公司并不多。”李彦宏表示,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体。
他以公司类智能体举例,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。比亚迪的官方智能体上线后,销售转化率提升119%,联想AIPC智能体的9月互动率提升89%。
此外,李彦宏展示了角色、工具和行业等多类智能体的特色功能及使用场景。例如百度文库和百度网盘联合打造的工具类智能体“自由画布”,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。再比如,法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”在李彦宏看来,智能体的门槛低、天花板高,既能让人人都上手,又能做出复杂强大的应用。当天,他展示了文心智能体平台的TOP100智能体,既有农民院士智能体等角色类,也有工具、行业、职场、情感、娱乐等各类场景的智能体。目前,文心智能体平台已吸引了15万家企业和80万名开发者。
无代码“秒哒” 打造数百万“超级有用”的应用
演讲结尾,李彦宏带来了当天的One More Thing——无代码工具“秒哒”,一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。它可以帮助更多人、更多企业打造出数百万“超级有用”的应用。
他介绍说,无代码编程,由大模型直接生成代码,不需要人写一行代码。它门槛很低,人人可上手;多智能体协作,是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;多工具调用,是通过文心大模型的工具调用能力,可调用网页检索、iRAG、地图API等各类型工具。
演讲现场,李彦宏以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。
就像工作场景中的团队合作一样,在现场演示的“秒哒”开发过程中,小组长、策划、小编、程序员和质检员五个智能体互相协作,协同完成策划、内容和开发等各种工作,还能自动识别bug、调用各种工具。李彦宏表示,这是“迄今为止人类历史上最复杂的多智能体协作工具”。
“一个人通过自然语言交互,就可以完成一套系统的搭建,除了上面展示的邀请系统,还可以做任意场景下的各种应用,应用的复杂度也会随着我们技术的提升不断提升。”李彦宏总结说,这意味着每个人自己就能指挥多个智能体来协同完成任务,“只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。
在他看来,无代码的秒哒让每个人都具备程序员的能力,会说话就能做出应用,极大提升了人类的工作效率。“AI之所以被称为产业革命级的机会,就是因为它对社会经济,带来了生产力的无限扩张。
l
李彦宏演讲观点集锦
不是要推出一个超级应用,是要打造数百万「超级有用」
1、过去这24个月,对AI行业而言,最大的变化是什么? 我的回答一定是,大模型基本消除了幻觉,回答问题的准确性大幅提升了,这让AI从“一本正经的胡说八道”,变得可用、可被信赖。
2、今天,基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。
3、智能体是AI应用的最主流形态,即将迎来它的爆发点。智能体可能会变成AI原生时代,内容、信息和服务的新载体。
4、未来,公司官方智能体很可能将替代官网,成为直接面向消费者的第一界面。
5、百度不是要推出一个“超级应用”,而是要不断地帮助更多人、更多企业打造出数百万“超级有用”的应用。
6、AI之所以被称为产业革命级的机会,是因为它对于社会经济,带来了生产力的无限扩张。
7、秒哒(无代码)让每个人都具备程序员的能力,会说话就能做出应用,对于人类工作效率的提升怎么说都不为过。
回顾过去一年,李彦宏的AI应用思考:「用」是最核心的关键词
● AI应用发展趋势
8、没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值。
9、大模型对于ToB业务的改造,会是非常深刻和彻底的,比互联网对于ToB的影响力要大一个数量级。
10、我们要避免掉入‘超级应用陷阱’,觉得一定要出现一个10亿DAU的APP才叫成功,这是移动时代的思维逻辑。
11、未来的编程语言只会剩下两种,一种叫做英文,一种叫做中文。
12、中国更注重应用驱动。尽管中国市场上有数百种基础大模型,但人们更关心产品与市场的契合度(PMF)。
13、应用驱动可以推动基础模型的创新,也有助于加速从互联网时代向人工智能时代的转变。
● 最看好的AI应用方向: 智能体
14、智能体是我最看好的AI原生应用发展方向。智能体相当于PC时代的网站和自媒体时代的账号,它最明显的特点是门槛足够低,谁都能上手,天花板又足够高,可以做出非常复杂,非常强大的应用。
15、搜索是智能体分发的最大入口。
16、大模型应用的发展阶段,一开始是Copilot,然后是Agent智能体,最主要的是它有了自主性,能自主使用工具、反思、自我净化。这种自动化程度再发展,就会变成Al Worker,能够独立完成各方面的工作。
● 开源模型与商业化模型
17、当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低,这时,商业化模型是最能打的。
● 大模型技术创新
18,模型之间的差距是多维度的。行业往往更关注理解、生成、逻辑、记忆等能力的差距,但却忽视了成本、推理速度等维度,有些模型虽能达到同样效果,但成本高、推理速度慢,还是不如先进模型。
19、大模型的天花板很高,今天做到的和理想状况差得还非常远,所以模型要不断快速迭代、表新和升级。要能几年、十几年如一日地投入,不断满足用户需求,降本增效,模型之间的差距就会越来越大。
20、在一个完全竞争的市场环境中,不要觉得领先12到18个月是个很短的时间,只要能永远领先竞争对手6个月,你就赢了。
● AI与人类社会的未来
21、替代旧工作、创造新工作,不是一夜之间就会发生的。这将需要10年、20年,甚至是30年才会逐步实现,人类会有时间为此做好准备。
● AI 创新与长期主义
22、生成式AI的泡沫过后,那些无法满足市场需求的伪创新将会被清洗掉,在这之后,有1%的企业将脱颖而出,继续成长,为社会创造巨大价值。
23、大模型是一次颠覆式的技术革命,我对它的长期前景非常乐观。面对新的技术周期,坚持长期主义的创业者必将脱颖而出。
【图文来源】微信公众号: 大变局下的中国管理