最复杂多智能体发布!百度推出“秒哒”和文心iRAG
情感
2024-11-12 18:38
重庆
11月12日,百度创始人李彦宏在百度世界2024大会上发表了主题为《应用来了》的演讲,同时发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。幻觉问题是大模型广泛应用的最大限制之一,特别是在文生图领域,一些特定场景如长城、金字塔,特定人物爱因斯坦、贝多芬等,是出现幻觉的重灾区。目前业界认为解决文本生成幻觉最好的技术就是RAG,即检索增强生成。RAG技术的原理是通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力。RAG的核心优势在于它能够解决大语言模型在处理知识密集任务时遇到的挑战,例如生成幻觉、过时知识、缺乏透明推理过程等问题。通过检索外部知识库来增强大语言模型的能力,RAG能提高生成内容的准确性、相关性和丰富性。基于RAG,百度开发了检索增强的文生图技术iRAG(image based RAG),该技术将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种真实的图片,李彦宏认为iRAG生成的图片“整体效果远远超过文生图原生系统,去除了机器味儿”。iRAG技术的运用能极大地提高了AI生成图片的可用性和商业化。例如品牌宣传,在高成本的商品宣传海报项目使用iRAG技术后,创作成本接近于0。简单而言,李彦宏认为,文心iRAG的商业价值体现在无幻觉、超真实、没成本,立等可取。此外,在影视作品、漫画作品、连续画本等应用场景中,iRAG的进入将大幅降低创作成本。同时,百度还推出了“自由画布”这一工具类智能体,让使用者可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。这一工具可以激发人们的灵感和创造力,推动内容创作领域的革新。此外,无代码工具“秒哒”也是此次发布会的重点,李彦宏将其称之为“迄今为止人类历史上最复杂的多智能体协作工具”。智能体是AI的最主流形式,也是今年最热的研究方向,它能够在特定环境中自主执行任务或作出决策,因此在AI商业化中扮演越来越重要的角色。从趋势来看,智能体将成为内容、服务和信息的新载体。例如在公司类智能体上,它们将取代传统的PC官网模式,成为根据顾客的需求推荐产品,在服务时更直接、快速地响应需求的客服、销售,公司类智能体不仅能展示公司基本信息,更能及时响应和提供一对一服务能力。秒哒智能体最突出的特性就是极大地降低了智能体的使用难度,并保留高水准的搭建能力。从特性来看,秒哒具备无代码编程、多智能体协作和多工具调用三大特征,使用者只需要输入想法就能构建出各种应用。李彦宏以萝卜快跑新技术发布会为例,展示了用秒哒在几分钟内,搭建活动报名系统的过程。只要在秒哒上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。此外,李彦宏还补充道:“秒哒可以做任意场景下的各种应用,应用的复杂度也会随着技术的提升不断提升。这意味着每个人自己就能指挥多个智能体来协同完成任务。我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”数据显示,截至11月初,百度文心大模型的日均调用量超15亿次,相较5月披露的2亿增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。作为作为国内最早重视AI的科技公司,百度对于AI领域的感知力要比其它企业更加敏锐,此次AI应用产品的发布,或许预示着AI应用时代真的要来了。