领导者管理笔记
重要消息:微信公众号又改版了,即便我每天都按时发文,你也可能收不到信息,甚至可能永久失联。唯一的办法就是把“领导者管理笔记”公号设置星标☆,这样才能每天照常收到文章。加(微信:New-leaders)进管理交流群。
OpenAI掀起的这一波大模型浪潮已经火热了近两年时间,AI技术以前所未有的速度进行迭代和创新,从大公司到创业者再到风险投资,纷纷寻找生成式AI时代基于大模型的超级应用。
但客观来说,业界期待的“杀手级应用”直到今天还没有出现。
这场全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?
在11月12日的百度世界2024大会上,百度董事长李彦宏用一张图回答了这一业界疑问。
在谈及外界的AI泡沫争议时,李彦宏身后的屏幕上显示出一张文心大模型的日均调用量变化曲线图,这一曲线呈现出陡峭式增长。数据显示,百度文心大模型日调用量达15亿,半年增长率达7.5倍。而相较一年前首次披露的5000万次,增长约30倍。
“在过去18个月当中,中国的大模型应用爆发可以用这张图或者这个曲线来代表。”李彦宏不无自信地说。他透露,6个月前百度文心大模型日调用量数据还是2亿,自己曾在和百度高管讨论大模型的未来时说,“如果我们大模型日均API调用量一年之内涨10倍,我认为就成了。现在仅仅半年过去,我们就比较接近这个数字了,势头非常猛。”
今日,百度发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”,并杀入智能眼镜领域。李彦宏还预计,智能体是AI应用的最主流形态,即将迎来爆发点,它将成为AI原生时代,内容、信息和服务的新载体。
靠想法赚钱的时代来了
过去一年,李彦宏围绕AI的思考,“应用”是最核心的关键词,为此,他曾在多个公开场合向行业疾呼应用的重要性。
在百模大战轰轰烈烈时,他就直截了当地提出:要卷AI原生应用,不要卷大模型”,并泼冷水道:“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”
在今年世界人工智能大会上,他指出“超级能干”的应用比“超级应用”更重要,业界避免掉入“超级应用陷阱”,觉得一定要出现一个DAU10亿的APP才叫成功,在AI时代,“超级能干”的应用只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。
而在海外出席马克龙AI沙龙中,李彦宏谈及中国AI与西方的最大区别时认为,主要在于应用。
一年前,行业里常常把大模型技术落地应用比作是“拿着锤子找钉子”,到了今年,尽管“超级应用”至今尚未出现,但从技术角度而言,基础模型的能力已经准备就绪,而AI技术已经不再局限于简单的问答、个性化推荐、自动化文本编辑等初级应用,而是正逐步深入到经济和社会的每一个角落,开始为解决实际问题提供强大的支持。
在今日主题为《应用来了》的演讲中,李彦宏说:“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”
现场,他发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”。文心iRAG用于解决大模型在图片生成上的幻觉问题,极大提升实用性;无代码技术“秒哒”让每个人都拥有程序员的能力,将打造数百万“超级有用”的应用。
此前,完全基于大语言模型的文生图系统,生成的图片往往“一眼假”,甚至逻辑不合常理。现场,他展示了一张用开源大模型生成的北京天坛的图片,看上去确实有点像天坛,但错把天坛的三层生成了四层。类似地,针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,张冠李戴的幻觉现象普遍存在,这也是为什么今天的多模态大模型还没有什么成规模应用跑出来的原因。
他回忆,今年年初时,大模型幻觉现象泛滥,百度决定着手解决图像生成的幻觉问题。百度iRAG将百度搜索的亿级图片资源跟强大的基础模型能力进行结合,这样就可以生成各种超真实的图片,整体效果远远超过文生图的原生系统,去掉了机器味儿。
现场,他以“画一张大众揽巡汽车飞越长城的图片,写实风格”作为提示词,生成的图片放大来看,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题,二者的融合度较高。
随着AI生成图片可用性的提高,应用空间也正在打开,例如影视作品、漫画作品,连续画本,海报制作等,AI生图都可以大幅降低创作成本。“比如在品牌宣传场景,以前拍这样一组海报动辄需要一二十万,甚至大几十万,但是现在这种创作的成本接近于0。”李彦宏说。
当天,李彦宏还发布了One More Thing——无代码工具“秒哒”,一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点。用户只需说说话,就能构建出各种应用。它可以帮助更多人、更多企业打造出数百万“超级有用”的应用。
演讲现场,李彦宏以萝卜快跑新技术发布会为例,展现了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。
在现场演示的“秒哒”开发过程中,小组长、策划、小编、程序员和质检员五个智能体互相协作,协同完成策划、内容和开发等各种工作,还能自动识别bug、调用各种工具。李彦宏表示,这是“迄今为止人类历史上最复杂的多智能体协作工具”。
“一个人通过自然语言交互,就可以完成一套系统的搭建,除了上面展示的邀请系统,还可以做任意场景下的各种应用,应用的复杂度也会随着我们技术的提升不断提升。”李彦宏总结说,这意味着每个人自己就能指挥多个智能体来协同完成任务,“只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”
一系列基础模型能力已经准备就绪,李彦宏判断,业界即将迎来AI应用的群星闪耀时刻。“每一个应用都是一颗星,每一个应用都将成为改变世界的力量。”
智能体即将迎来爆发点
AI超级应用最有可能在哪个领域出现?今日,李彦宏重点提及两个AI应用方向:智能体和产业应用。
“智能体是AI应用的最主流形态,即将迎来它的爆发点。今天,全球所有顶尖科技公司都很关注智能体,但像百度这样把智能体作为最重要战略方向的并不多。”他说道。
做智能体类似于PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人,更智能。智能体可能会变成AI原生时代,内容、信息和服务的新载体。
这是因为,一方面做智能体的门槛足够低,谁都能上手。他透露,在百度的文心智能体平台上,甚至已经有11岁的小学生在创造智能体,再通过搜索和其他渠道分发。另一方面,智能体的天花板又足够高,可以做出功能非常强大的应用。多个智能体的协作,还可以解决更加复杂的问题。
百度数据显示,目前文心智能体平台上,已经吸引了15万家企业和80万名开发者参与,覆盖的应用场景众多,有角色类的,如农民院士智能体,有工具类、行业类的智能体,以及职场、情感、娱乐等类型的智能体。
不少企业已经展开智能体应用。与传统官网的静态展示不同,企业智能体能够对最新信息或者最个性化问题的回答。数据显示,比亚迪的官方智能体上线后,销售线索转化率提升了119%。联想AIPC智能体在9月份的互动率提升了89%,销售线索转化率提升了80%。
“未来,公司官方智能体很可能将替代官网,成为最直接面向消费者的界面。”李彦宏预计。
李彦宏还展示了角色、工具和行业等多类智能体的特色功能及使用场景。以数字人为例,在百度搜索“教育辅导”关键字后,记者看到,搜索结果页中出现不少数字人的视频内容。这些数字人,动作、语言、口型非常自然,并且能够在合适的时机停下,回复网友现场提出的问题。
“如果不说的话,你都不知道是数字人。” 李彦宏称,今天的数字人直播,很多情况下,转化率已经超过了真人。
而在AI重构百度自身业务方面,百度文库和百度网盘联合打造的工具类智能体“自由画布”,用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。
以行业分析师撰写研究报告为例,通过自由画布,未来研究报告可能会是包括传统的图文、表格、发布会视频、电话会录音等更加多模态的呈现方式。
在演讲现场,“自由画布”还根据李彦宏的要求,生成了一个大圣穿越到现代探险故事,并随后生成了漫画和视频。可以看到孙悟空不仅形象具有一致性,还结合故事情节做出了对应的动作,让故事更加生动。
他总结,因为自由画布,每个人都可以成为漫画家、短视频导演。而且,这不是期货,而是立即可用的现货,是真正服务于创造的新质生产力。
而在法律、医疗健康、金融、体育、旅行等等领域,也都已经涌现出不少有用的智能体。
李彦宏介绍,法律智能体“法行宝”已经回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配的人类律师。
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”李彦宏预计。
AI加速走入应用场
随着人工智能技术加速进步,AI在千行百业的应用也越发深入。
当天,百度发布了基于大模型的100大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。李彦宏说,这其实也代表百度的认知和态度。百度不是要推出一个“超级应用”,而是要不断地帮助更多人、更多企业打造出数百万“超级有用”的应用。
面向各类产业需求,百度CTO王海峰透露,百度打造了文心大模型矩阵,包括ERNIE 4.0 Turbo等旗舰大模型、ERNIE Speed等轻量模型,以及基于基础模型生产的系列思考模型和场景模型,满足不同应用的需要。
他还在现场披露,飞桨文心开发者数量已达1808万,服务了43万家企业,创建了101万个模型;百度已为社会培养了592万AI人才。
而在行业应用中,想在客户的特定场景里低成本做出好效果,往往需要定制模型。从某种程度上说,精调模型的数量反映了大模型与产业结合的深度。今日,百度集团执行副总裁、百度智能云事业群总裁沈抖在演讲中透露,“今年以来,这个数量增长地特别快。”
“光是百度内部的业务,每天就有200次模型精调 。千帆上,每天15亿的大模型调用里,超过一半的调用来自于这些精调后的模型。”沈抖说。
他还透露,为了支撑大模型的进一步高速发展,百度是行业内最早打磨10万卡集群能力的厂商之一。以算力平台百舸为例,目前国内的芯片供应仍然紧张,企业要确保供应链的安全和弹性,一云多芯是必然选择。在万卡规模上,百度可以将两种芯片混合训练下的效率折损控制在5%以内。
他举例,客户全诊医学是一家医疗AI创新公司,他们打造的AI智能医疗助理已经服务了50多家三甲医院和一万五千多家中小医疗机构。AI助理的重要功能之一,就是用AI来节省医生原本要花在整理和书写病历上的大量时间。问诊后,它只用2秒就能生成病历草稿。
而在体育领域,大模型等人工智能技术辅助国家队备战训练,为运动员夺金争银提供科技支撑。智能跳水辅助训练系统采用云、边、端一体化技术,全自动识别、跟踪、采集、分析每一个跳水动作。基于文心大模型,系统还可以对动作实时打分、精准量化分析,制定训练计划,对运动员身体数据进行科学评估和全面管理。
在巴黎奥运会拿下两块金牌的运动员全红婵在大会现场表示,AI系统对自己的训练帮助很大。“巴黎周期自己也长胖了,做动作感觉和之前不一样了,这套系统可以多角度还原我的动作,每到结束后教练都会给我看,同时也会和之前的动作对比,帮我把动作做得更好。”
可以说,AI之所以被称为“产业革命级”的机会,正是因为它对社会经济带来了生产力的无限扩张的可能。
李彦宏是软件工程师出身,国外有一种说法叫“软件吞噬世界”。但在演讲中,他略带感性地说,这个世界不应该被吞噬,而应该被创造。
据百度世界2024公布,截至11月初,百度文心大模型的日均调用量已超15亿,相较一年前首次披露的5000万次,增长约30倍。李彦宏表示“增速超出预期”,说明AI是真需求。他感慨,这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。
百度世界2024现场,李彦宏分享了百度在过去一年的技术创新最新成果,并发布多项与“超级有用”相关的技术、工具和应用方向,包括两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“秒哒”,以及两大AI应用方向:智能体和产业应用,李彦宏现场展示了四大类智能体、文心智能体平台TOP100智能体和TOP100产业应用。
重磅发布文心iRAG
解决AI生图幻觉难题
幻觉是影响大模型性能和规模化落地应用的最大限制之一。在李彦宏看来,过去24个月,AI行业的最大变化是大模型基本消除了幻觉,回答问题的准确性大幅提升了,这让AI从“一本正经地胡说八道”,变得可用、可被信赖。
回顾过去两年,李彦宏认为,检索增强生成(RAG)从百度特色,逐渐发展成为了行业共识。目前,文字层面的RAG已经做得很好,基本让大模型消除了幻觉;但在图像等多模态方面,和RAG的结合还不够,这也是百度希望重点突破的方向。
百度开发了文心iRAG(image based RAG),检索增强的文生图技术,用于解决大模型在图片生成上的幻觉问题。iRAG将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,“整体效果远远超过文生图原生系统,去除了机器味儿”,李彦宏表示。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。
同时展示的“爱因斯坦环游世界”图片中,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片。
iRAG技术极大地提高了AI生成图片的可用性,具备无幻觉、超真实、没成本,立等可取等商业价值。在影视作品、漫画作品、连续画本、海报制作等场景,iRAG都可以大幅降低创作成本。
AI应用最主流形态「智能体」迎爆发点
4类智能体、百大智能体亮相
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”李彦宏将做智能体类比为PC时代做网站、或是移动时代做自媒体账号,“不同之处是智能体更像人、更智能,更像你的销售、客服和助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
李彦宏现场展示了4种不同类型的智能体,包括公司类智能体,角色类智能体,工具类智能体和行业类智能体。
公司类智能体
在李彦宏看来,公司类智能体相当于AI时代的公司官网。“未来,公司官方智能体将替代官网,成为直接面向消费者的第一界面。”
他以比亚迪官方智能体举例,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率,比亚迪的官方智能体上线后销售转化率提升119%。如下动图展示,比亚迪官方智能体可以精准推荐“性能均衡”的车型,并展示产品图片:
不仅能生成图片,比亚迪官方智能体还可以用表格形式对比多种车型的参数:
角色类智能体
在大模型加持下,数字人逐渐变成了高度拟人化的智能体,更聪明、有情感、有态度。他们可能是教育辅导老师、留学顾问、也可能是心理咨询师,私人健身教练,都非常受欢迎。李彦宏表示,真人与虚拟人的交互,将创造巨大的产业价值和社会价值。
工具类智能体:自由画布发布
李彦宏展示了全新的工具类智能体,即百度文库和百度网盘联合开发的“自由画布”,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。
自由画布是一个由文心多模态大模型加持的万能白板,可以帮助用户完成从找资料,到编辑、生成和分享的全部任务。李彦宏表示,“这不是期货,而是立即可用的现货,是真正服务于创造的新质生产力!”
案例1:自由画布生成多模态调研报告
(1) 自由画布实现输入自由,文档、视频、音频等不限格式的文件都可以一键摘录到自由画布。
(2) 自由画布实现编辑自由,可以用批注的方式“指挥”AI对素材做各种编辑(调字号、排版等),告诉它如何利用各种素材。
(3) 自由画布根据全部素材,生成全格式、多模态的调研报告。
案例2:个人创作案例,创作“让大圣穿越到现代”的漫画、画布。
创作漫画以及漫画视频:
(1) 自由画本根据AI生成的故事脚本,生成了一幅漫画,孙悟空游览了山西、上海的打卡胜地。
(2)基于漫画内容,自由画布让AI生成了一个漫画视频。
创作个人定制画本:
(1) 上传1张小朋友照片,AI将他融入到画本中,生成了一个小朋友梦游花果山的故事。
(2) AI基于脚本生成了智能画本视频。
行业类智能体
李彦宏认为,在法律、医疗健康、金融、体育、旅行等领域,都会涌现出很多有用的智能体。
他现场展示了1个法律行业的智能体—法行宝,它可以帮助用户解答各类法律相关的问题。上线半年多以来,法行宝为940万人提供了高效、可信赖的法律服务,已经回答了1660万个问题,成为每个人免费的AI律师。
(1) 输入事故详细信息,法行宝的“赔偿计算器”功能,可以帮你计算事故造成的总损失和赔偿金。
(2) 法行宝可以帮你写一封起诉状。
李彦宏还展示了文心智能体平台的TOP100智能体,既有农民院士智能体等角色类,也有工具类、行业类,更有职场、情感、娱乐等各类场景的智能体。目前,文心智能体平台已吸引了15万家企业和80万名开发者。
不是要推出1个超级应用
而是要打造数百万“超级有用”的应用
百度公布了在产业应用方面的新进展,过去一年半,百度文心大模型落地金融、能源、教育、招聘、公共服务等领域,为企业切实带来了降本增效的效果。
例如在餐饮行业,百度为百胜中国打造的“客服大模型”客服问题解决率提升到了约90%,助力餐饮企业实现智能化转型。
目前百度文心大模型已拥有中国最大的大模型产业落地规模,据大会公布,百度智能云千帆大模型平台上已经累计帮助用户精调了3.3万个大模型,开发出了77万个企业级应用。
李彦宏在现场发布了大模型的100大产业应用,涵盖了制造、能源、交通、政务、金融、汽车、教育、互联网等众多行业。
李彦宏表示,“发布这100大产业应用,其实也代表我们的一种认知和态度。百度不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用”。
OneMore Thing
无代码工具“秒哒”发布
助推更多“超级有用”的AI应用诞生也需要工具基础。在演讲结尾,李彦宏带来了当天的OneMore Thing —发布无代码工具“秒哒”,可以帮助更多人、更多企业打造数百万“超级有用”的应用。
“秒哒”具备无代码编程、多智能体协作和多工具调用三大特性。作为一个不需要写代码就能够实现任意想法的工具,秒哒让每个人都具备程序员的能力,会说话就能做出应用。李彦宏总结说,“只要有想法,你就可以心想事成,我们将迎来一个前所未有的只靠想法就能赚钱的时代。”
李彦宏以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥小组长、策划、小编、程序员和质检员五个智能体协作,完成报名系统的开发。
案例:“秒哒” 生成萝卜快跑新技术发布会的活动邀请函
(1) 告诉“秒哒”需求 :“我要为萝卜快跑的新技术发布会做个嘉宾邀请和管理系统,并且能收集他们的猜测和想法。”
(2) 首先,0号智能体作为小组长进行规划调度,会将任务拆解并召唤各智能体来完成任务。
(3)1号智能体(策划智能体),将策划设计解决方案拆分成:核心需求、内容结构、开发需求、数据收集四个子任务。
(3)2号智能体(小编智能体),编辑邀请函中的所有文字和媒体内容,包括发布展望、时间地点信息、封面图等。
(4)3号智能体(程序员智能体),写代码来制作和部署网页。
(5)4号智能体 (质检员智能体),检查代码bug并修复、进行代码测试。
(6) “秒哒” 生成了邀请函,还可以让它生成一个更有科技感的邀请函。
在李彦宏看来,无代码的秒哒让每个人都具备程序员的能力,会说话就能做出应用,极大提升了人类的工作效率。“AI之所以被称为产业革命级的机会,就是因为它对社会经济, 带来了生产力的无限扩张。”
@THE END
欢迎加入10W+领导者社群
文章来源 :领导者养成笔记「ID:GoToLead 」,转载请公众号回复“转载”
版权说明 :我们尊重原创者版权,除我们确实无法确认作者外,我们都会注明作者和来源。在此向原创者表示感谢。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权立即删除内容;本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。