11月19日,百度创始人李彦宏在2024中国5G+工业互联网大会上,发表了主题为《大模型促进科技创新和产业创新》的演讲。
截至11月初,百度文心大模型的日均调用量达到15亿,相较5月披露的2亿增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。尤其是最近半年,增速非常快。李彦宏表示:“大模型调用量高、增速快,表明有越来越多的应用在使用文心大模型。”
为什么最近半年基础模型调用量增速这么快?或者说什么技术提升导致了基础模型突然变得很有用呢?李彦宏认为:“主要是检索增强(RAG)的能力。大模型最初发布的时候有幻觉,经常会一本正经地‘胡说八道’,当模型有‘幻觉’,会随机生成各种各样的内容时,在绝大多数场景之下是不可用的。”
过去24个月,大模型最大的变化就是基本消除了“幻觉”。检索增强最初是百度特色,现在已经变成行业共识。今天文字层面的RAG已经做得很好,让大模型变得可用、可被信赖。图像等多模态技术要实用,也需要准确性和可控性,从而拓展AI应用空间。
为此,百度花了很多精力解决图片生成的“幻觉”问题,开发了检索增强的文生图技术iRAG(image based Retrieval-Augmented Generation),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。在全球范围内,百度的这项能力都是最领先的。
“现在用文心多模态模型进行生成,可以去掉‘幻觉’,去掉所谓的‘AI味’,生成的图片看上去更真实,保留了准确性。”李彦宏认为:“未来多模态的检索增强也会有快速的发展,从而使得多模态大模型进入更加实用的阶段。”
除了检索增强技术,大模型另外一个重要发展方向是智能体,而智能体的最终极形态是多智能体的协作。11月12日,百度在百度世界2024大会上发布了无代码工具“秒哒”,这是一个非常复杂的多智能体协作应用。
据悉,和市面上的其他辅助代码生成工具不同,“秒哒”不需要人们看懂一行代码,可以让非程序员具备程序员的能力。涵盖无代码编程、多智能体协作以及多工具调用等特点,只需通过自然语言,就能构建出各种应用。
李彦宏公布了“秒哒”的最新进展:“‘秒哒’发布后仅仅3天,就有超过5000家企业排队申请测试”。“现在全球大概有2800万程序员,但全球有80亿人口,绝大多数人是看不懂一行代码,无法用编程的方法来解决问题。当每个人都具备程序员能力的时候,对整个社会的生产力是一个极大的释放。”李彦宏说。
基础大模型的能力已经就绪,应用驱动的产业创新正在快速落地。大模型在制造、能源、金融、公共服务等各个领域落地之后,在降本和增效两个方面都取得了实实在在的成果,同时也带来了产业创新的新机会。
李彦宏举例,大模型在自动驾驶领域也有非常好的应用,现在讲的端到端、纯视觉大模型、L4级无人自动驾驶,背后都是大模型技术。百度的最新一代无人车,是世界上唯一一款前装量产的L4级无人车。
据了解,百度从 2013 年开始布局自动驾驶,2017 年推出了全球首个自动驾驶开放平台 Apollo。Apollo 既是中国自动驾驶国家队,也是世界领导者,是全球最活跃的自动驾驶开放平台。今年5月,百度率先发布了全球首个L4级端到端的自动驾驶大模型Apollo ADFM,可以兼顾技术的安全性和泛化性,做到安全性高于人类驾驶员10倍以上。搭载这一大模型的自动驾驶开放平台——Apollo 10.0版本,也即将面向全球用户发布,这一升级将大幅提升自动驾驶开放平台的安全性、智能化和易用性。
“人工智能是新一次的工业革命,今天很多关于大模型,关于生成式AI的讨论,都在拿它和PC互联网和移动互联网进行类比,但我们更多应该参照蒸汽机革命,电力革命和信息革命的发展过程,从中借鉴发展过程当中一个国家、一个公司,或者一个个人,怎么从中尽可能多地获益,怎么能够避免有可能产生的负面作用。这样,我们才可以真正利用好这次新的工业革命,利用好大模型,为各行各业赋能,为社会生产效率提升,为人的美好生活做出更好的贡献。”李彦宏最后说道。
编辑:吴双 于莉莉
监制:蔡旸