是什么让奥运冠军
全红婵、陈芋汐、曹缘
突降百度世界2024会场?
科技馆也能变身智能体?
历经几年发展
中国AI应用有哪些
新的变化和突破?
未来
AI应用的主流是什么?
不懂编程
也能用AI开发应用吗?
有了AI
我们就能在虚拟世界“心想事成”
并在现实世界赚钱吗?
这些看似科幻的问题,在昨天上海世博中心如期举办的百度世界2024上,百度创始人李彦宏用主题为《应用来了》的演讲一一作了解答,并很肯定的宣布:过去的24个月,这个行业最大的变化是大模型基本消除了幻觉,回答问题的准确性大幅提升;智能体是AI应用的最主流形态,即将迎来爆发点;只要有想法,你就可以心想事成,我们将迎来一个前所未有的只靠想法就能赚钱的时代。
目前,基于大语言模型的文生图还有比较严重的幻觉,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。
针对上述问题,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,“整体效果远远超过文生图原生系统,去除了机器味儿”。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。同时,他还展示了“爱因斯坦环游世界”图片,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片。
这一技术的商业价值潜力巨大。从大众揽巡飞跃长城就能看出,以往拍摄一组海报可能需要耗费大几十万的成本,而如今借助iRAG,创作成本几乎可以忽略不计,这个应用还可以广泛的存在于影视作品、漫画作品、连续画本、海报制作等诸多应用场景中,iRAG既能大幅降低创作成本,又能以其“无幻觉、超真实、没成本,立等可取”的特点,为相关行业带来了巨大的便利和经济效益。
更为重要的是,李彦宏认为,消除大模型的幻觉,也是AI应用爆发的基础,行业即将迎来AI应用的群星闪耀时刻。
无代码“秒哒”是一款不需要写代码就能实现任意想法的软件,简单来说,只需说说话,就能构建出各种应用,人人可上手。
演讲现场,李彦宏以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。
就像工作场景中的团队合作一样,在现场演示的“秒哒”开发过程中,小组长、策划、小编、程序员和质检员五个智能体互相协作,协同完成策划、内容和开发等各种工作,还能自动识别bug、调用各种工具。李彦宏表示,这是“迄今为止人类历史上最复杂的多智能体协作工具”。
“一个人通过自然语言交互,就可以完成一套系统的搭建,除了上面展示的邀请系统,还可以做任意场景下的各种应用,应用的复杂度也会随着我们技术的提升不断提升。”李彦宏总结说,这意味着每个人自己就能指挥多个智能体来协同完成任务,“只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”
李彦宏坚定的认为,智能体是AI应用的最主流形态,且即将迎来爆发点。
他以公司类智能体举例,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。例如,比亚迪的官方智能体上线后,销售转化率提升119%,联想AIPC智能体的9月互动率提升89%。
此外,李彦宏展示了角色、工具和行业等多类智能体的特色功能及使用场景。例如百度文库和百度网盘联合打造的工具类智能体“自由画布”,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。再比如,法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。
在李彦宏看来,智能体的门槛低、天花板高,既能让人人都上手,又能做出复杂强大、超级有用的应用。目前,文心智能体平台已吸引15万家企业和80万名开发者,其展示的TOP100智能体涵盖了农民、院士智能体等角色类以及各种场景的智能体,将在未来的AI应用领域占据重要地位。
无疑,百度再一次站在了行业至高点。
✎