百度:让大模型应用更落地
科技
2024-11-19 18:32
广东
2022年11月30日,OpenAI正式发布ChatGPT,像一个炸雷,使用者为之震惊,从业者为之兴奋。投资人和创业者更是摩拳擦掌,争先恐后的冲入大模型赛道。根据中国信通院《全球数字经济白皮书》显示,不到两年,全球AI大模型数量高达1328个,美国的AI大模型数量位居第一,占比44%;中国大模型数量紧随其后,占比36%,大约478个。白驹过隙,忽然而已。730天,看似风起云涌的大模型创业潮,却使得创业者和投资人倍感焦虑——看上去“无所不能”的大模型却始终无法找到清晰的盈利模式,即便是率先做出“超级应用”的OpenAI也不例外。大模型赛道光速祛魅,Scaling Law 的紧箍咒越匝越紧,AGI还遥遥无期。正是在这样的背景下,在今年的百度世界大会上,李彦宏旗帜鲜明地高呼“应用来了”,似乎标志着风起云涌的大模型行业2.0时代正在到来。大洋彼岸的 OpenAl 常被视为当世最佳 AI 公司。它凭一已之力让 Transformer 架构大放异彩,引领技术变革潮流,使全球在 AI技术上以它为标杆,估值超 1500亿美元,风光无限。从ChatGPT问世到Sora 爆红,国内不少大模型厂商都跟风开启了“军备竞赛”。面对人人向往的“超级应用”,如何认清自身定位、保持定力做好自己的事,对百度的战略都是巨大考验。2023年3月,很多人问李彦宏,为何此时发布文心一言?他的答案是,不少下游企业和合作伙伴,都希望将大模型能力应用到自身业务当中。而正是基于市场需求,百度推出了文心一言。而面对Sora 的爆红,百度却决定 “不碰 Sora 类的视频生成”,原因不仅在于投入周期太长,而且难以商业化应用。百度的选择是,着手解决多模态大模型的幻觉问题。李彦宏介绍,百度在开发各种各样应用过程中遇到的一个障碍,就是大模型的幻觉。“必须把障碍搬走之后,我才能再往前走。”为了解决文生图的幻觉,百度研发了iRAG(检索增强文生图技术)。其将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,去除生成图像的“机器味”。李彦宏在世界大会后的媒体访谈中提到:美国很多公司一直都是梦想说我要做颠覆性的技术,我要多少年之内做成什么什么样子。我更多希望尽早接触场景及接触应用,看在这个过程当中,到底遇到了什么问题,把这些问题带回来,看大家遇到的最多的问题,就是我们优先解决的问题。”看得出,从早期 “不要重复造轮子”、“开源闭源无需争,不如考虑谁创造价值更多”,到如今 “百度不是要做一个‘超级应用’,而是要让更多人做出更多‘超级好用’的应用”,李彦宏一直专注于让大模型能“落地”。这种解决满足市场需求、解决具体问题的思路,始终贯穿在百度大模型落地的过程中。文心一言发布后,百度接连推出文心百度智能云千帆大模型平台、文心智能体平台,在工程化方面下足功夫。百度在千帆平台上做了 ModelBuilder,以最简方式帮用户精调大模型,使其更专业。不少用户反馈大模型做应用难、成本高且没经验,千帆又做了 AppBuilder,从高效去幻觉、整合组件、适配场景、多模态等角度将制作应用做到极致。如今,千帆大模型平台已帮客户精调 3.3 万个模型、开发 77 万个企业应用。目前,已经有60%的央企在使用百度智能云进行AI创新。在行业鼓吹了几年“低代码”后,百度在世界大会上拿出了完全技术普惠的、普通人也能用的无代码开发工具“秒哒”。使用者无需懂一行代码,就能凭借自己的创意制作应用,最终提升生产力,甚至直接获利。在媒体访谈中,李彦宏也提及:"辅助代码工具只是让处于金字塔尖的人更加强大,而我们期望金字塔的中层和底层人群拥有塔尖人群的能力,这更具意义,因此我们将主要精力放在这方面。"对成千上万的创业者、开发者而言,百度通过工程方法把门槛一降再降,让大模型惠及众多使用者。在这个害怕错过(Fear of missing out)的时代,知道自己的使命,不为眼前的焦虑而让动作走形,坚持做好自己的事,考验的是战略眼光,也考验战略定力。有了大模型落地的工程性基础,如何做好大模型应用?其实并没有标准答案。在今年世界大会的演讲中,李彦宏说:智能体是AI应用的最主流形态,即将迎来爆发点。事实上,目前智能体仍存在很大争议。与传统大语言模型的价值已成为共识不同,不少人认为智能体未来无法成为新的应用技术范式。李彦宏在内部会议上也说,智能体现在确实还不是行业共识,是百度的一个洞察或者是bet,百度赌智能体会变成内容、服务、信息的新载体。为此他愿意下注。一年前,人们发现大模型必须在应用方面发力,众多厂商努力创新,要么将 AI 融入现有应用,要么大力开发原生应用,从而找到新的发展方向。但在开发过程中,人们意识到,作为全新领域,没人掌握产品成功的秘诀。怎么做?这个方向是否可行?如何利用 AI 能力创造价值?这些问题都悬而未决。在诸多不确定因素下,应用若要突围,只能靠数量取胜 —— 大量应用同时推出,总有一两个能成功。于是,开发更易用、门槛更低的智能体,在开拓 AI 市场时承担了更重要的使命。如今,每周都有数万个新智能体在文心平台被创造出来,尝试开拓更多市场方向。其次,作为 AI 下一个时代的机遇,智能体有创造平台价值的关键潜力。在移动互联网时代,每个流量入口都可以被简称为 “应用”。而在 AI 时代,应用模式或许不会消失,但应用必须更智能,更具独特性和功能性。“我们想象的分发的机制或者流量入口,比较类似于现在的百度搜索。”李彦宏讲道,“在百度里搜相应的词,出来的就有可能是一个智能体。”若智能体能够替代 “应用”,在时代交替之际,谁能在平台上拥有更多爆款智能体,谁就能获得巨大流量和平台优势,从而在 AI 赛场下一阶段占据统治地位。于是,百度在 2024 年世界大会上公布了四类智能体,抢先完成了第一阶段布局。•公司类智能体负责“离钱更近”的营销大场景,最先创造收益;•角色智能体兼顾直播、泛娱乐领域,和一些大型企业机关的品牌建设工作;•行业智能体则把重点行业吃深吃透,拿住高价值客户。更深层次上,智能体的出现与李彦宏多年来的战略路线有着微妙的契合。过去 20 年,百度通过搜索引擎,极大地改变了用户获取知识的方式,信息输入人脑的方式,从看书读报,变成了“百度一下,你就知道”。如今在智能体加持的智能时代,每个人都能 “一人成军”,百度开启了新征程 —— 通过开发更多应用,让每个人都能制作信息产品并推广,人们把信息向外输出的方式,也从“写博客发朋友圈”,变成了制造属于自己的智能体。这意味着,百度对网络世界的变革,正在从 “信息输入” 向 “信息输出” 拓展。在这个改变的过程中,技术就是手段,让每个人都能享受 AI 红利。百度在 AI 领域十年如一日,积累下来的不仅仅是一个又一个的技术成果和技术产品,而是对人工智能事业的“相信”。“百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。”相信AI的百度,在第一个十年,投入搜索引擎和算法;在第二个十年,又全面投入深度学习。二十余年对技术和技术落地的信仰——百度做大模型落地的底气大抵来源于此。然而,大模型“火”了已经两年,却久未见“超级应用”真正引爆市场,焦虑如同春季雨后疯长的野草,长在每个人的心上。但李彦宏似乎并没有“超级应用焦虑”。他说人工智能很像是一次新的工业革命,“这意味着它不是三五年就结束,不是一两年就出现超级应用。它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。”他说创业的时候觉得是“开始”,公司上市的时候觉得是“开始”,现在仍然觉得是“开始”,还是有极大激情。雷峰网觉得,这一段话既能表达李彦宏的心迹,用来评价大模型产业也很合适——一个新时代,才刚刚开始。