吴恩达最新观点：LLM的下一个新兴方向是Agentic AI

科技 2024-11-17 18:49 广东

夕小瑶科技说原创
作者 | 小鹿

最近，吴恩达老师在 deeplearning.ai平台上对LLM的发展演进做了一段精彩的分析，预测了LLM下一个新兴方向是朝着agentic workflows优化。

Agentic AI 是未来，正在路上。

作为deeplearning.ai（AI教育平台）创始人、百度前首席科学家、Coursera的现任董事长兼联合创始人、斯坦福大学的兼职教授的吴恩达老师，不知道有多少人和我一样，是从Andrew Ng的课程可是入坑AI的。

Andrew Ng是AI民主化和普惠性的坚定主义者，一直从事让AI教育平民化工作，对AI发展趋势的判断具有很强的前瞻性。

一起看看他对未来LLM发展方向的思考和判断吧。

他的核心观点是，认为 LLM 正在从主要优化消费级问答体验，转向优化支持智能体工作流（如工具使用、计算机操作、多智能体协作等）。

模型优化正向着适配智能体工作流发展

在此之前的阶段，各大厂训练优化大语言模型的主要目标是回答好问题。

自从ChatGPT问世以来，大家开发LLM的重点都是为消费者提供更好的用户体验，回答消费级的问题，例如，“为什么莎士比亚要写《麦克白》？”。或者，执行人类指令任务。例如，“解释莎士比亚创作《麦克白》的原因”。

但是，随着AI应用的不断扩展，这些模型逐渐调整、升级以适应代理任务的工作流程，而这一趋势正在显著提升模型代理任务的性能和多功能性。

此前，大语言模型的训练过程通常采用经过指令调整的数据集，以帮助模型生成更具针对性和实用性的回答，满足用户在面向消费者的大语言模型中的问题和需求。

而现在，AI代理的应用场景对模型的行为提出了更高的要求！

在代理任务中，模型通常需要在迭代工作流程中执行更复杂的任务，如自我反思和优化输出、使用工具辅助决策、制定详细计划，甚至在多代理环境中协作以完成目标任务。

工具使用的演变：从提示设计到原生功能支持

工具调用是AI代理中一个关键功能。

例如，当被询问当前的天气情况时，大语言模型其实是无法直接从训练数据中得出答案的，而是需要生成一个API调用请求以获取所需信息。

在GPT-4及其他模型原生支持函数调用功能之前，开发者通常通过复杂的提示设计（如ReAct提示变体）引导模型生成函数调用语句。随后，这些生成的字符串通过外部解析工具（例如正则表达式）来执行实际的API调用。

而随着GPT-4等模型引入对函数调用的原生支持，工具调用变得更加高效和可靠。

如今，LLMs能够自主决定调用何种函数以实现诸如检索增强生成（RAG）、代码执行、电子邮件发送、在线下单等功能，从而显著扩展其适用范围。

Anthropic计算机使用能力的突破

前段时间，Anthropic宣布Claude将学会使用计算机，可以模拟鼠标点击和键盘操作。

这一能力使模型能够直接与计算机环境交互，虽然过去一些团队已经通过提示设计引导大语言模型实现类似功能，用于构建新一代的RPA（机器人流程自动化）应用，但此次发布标志着主流大语言模型供应商对计算机交互能力的原生支持取得了重要突破。

这一进展不仅有助于简化开发流程，还将推动RPA及其他智能应用的大规模发展。

对未来的预期

随着模型适配代理任务的能力不断增强，未来的大语言模型可能不仅仅是一个高效的“回答者”，而且将成为一个多功能的智能代理。

在复杂的多任务、多工具、多代理的协作环境中，大语言模型将能够更高效地完成信息整合、任务分配与执行。随着模型性能和功能的持续进化，AI代理有望在提升生产力和解决复杂问题方面带来革命性的变革。

在AI代理工作流程日益成熟的过程中，吴恩达观察到以下几个关键点：

许多开发者正在引导大语言模型执行他们所需的代理行为，这使得快速且丰富的探索成为可能：在数量较少的情况下，开发者会对大语言模型进行微调，以更可靠地执行特定的代理功能。例如，尽管许多LLM原生支持函数调用，但它们通过接收函数描述作为输入，然后生成输出令牌来请求正确的函数调用。对于那些对生成正确的函数调用至关重要的应用，针对特定函数调用的微调可以显著提高模型的可靠性。（但请避免过早优化！我仍然看到许多团队在应该更多地使用提示之前就开始进行微调。）
当像工具使用或计算机使用这样的能力对许多开发者有价值时，主要的大语言模型提供商会将这些能力直接构建到他们的模型中：尽管OpenAI的o1-preview在高级推理方面帮助了消费者，但我认为它在代理推理和规划方面更为有用。大多数大语言模型已经针对回答问题进行了优化，主要是为了提供良好的消费者体验，目前已经能够将它们应用于复杂的代理工作流程中，以构建有价值的应用。构建原生支持代理中特定操作的LLM的趋势将大幅提升代理性能。在未来几年内，这个方向上的大量性能提升将会实现。

吴恩达老师的主要观点很明确，就是未来LLM优化方向会是逐步适应智能体工作流，也会在这个方向取得重大进展。

其实从Anthropic宣布Claude将学会使用计算机后，国内智谱也宣布了AutoGLM，它是让LLM学会使用手机，比如帮助用户完成各种日常任务，例如预订酒店、搜索攻略、点外卖等。也能是办公助手，帮助用户处理邮件、会议记录等工作，提高工作效率。

想象一下，LLM不再是单一的、整体的基础模型，而是大量专门的智能体实例，每个实例都会针对工作流程中的特定任务进行微调。它们不仅会履行指定的角色，自主工作，而且还会共同协作动态地完成更复杂的任务。

期待，AI具备独立行动和解决问题的能力的那一天的到来，exciting～

参考资料

https://x.com/andrewyng/status/1857117382378164267?s=46

http://mp.weixin.qq.com/s?__biz=MzIwOTA1MDAyNA==&mid=2650021108&idx=3&sn=2aba77349f3f408b95bd7adf2fd48c37

人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构

最新文章

万物智能演化理论（欧米伽理论）的核心观点

美国国家科学院院刊：人工智能的下一个进化，从我们开始

大语言模型技术演进与启示！

涌现的计算方法：从计算力学到层级涌现

走出元宇宙阴影、拥抱开源AI模型，Meta实现“扎克伯格式复兴”

瑞士洛桑联邦理工学院：人工智能中的创造力：进展与挑战

各路大佬纷纷给 AGI 立下“最后期限”，27 岁创始人已经给 AI 准备好「人类最终测试」！

陶哲轩宣布“等式理论计划”成功，人类AI协作，57天完成2200万+数学关系证明

谷歌 AlphaChip 论文再被质疑，DeepMind 驳斥都没做与训练，顺带还揪出了“内鬼”？

复旦大学：《大模型AI智能体的兴起和潜力：综述》

斯坦福大学发布全球人工智能实力排行榜

意识是一种模拟状态，它只能存在于梦中，而不是在物理世界中

步步紧逼谷歌！OpenAI正在研发与ChatGPT集成的浏览器

2秒完成检测，将AI与3D打印相结合，科学家实现小型核反应堆高级监测

从具身到智能，无尽前沿丨智源具身智能峰会观点集锦（上）

从具身到智能，无尽前沿丨智源具身智能峰会观点集锦（下）

Nature：刷新了传统认知！蔡欣童/刘长亮等揭示多巴胺快速波动既不调控运动、也不编码奖赏

Nature :谷歌学术搜索能否在人工智能革命中幸存下来？

AI智能体的崛起，开启人工智能的下一个黄金时代

强化学习之父Richard Sutton：AGI研究的下一个范式

Science:如何理解大模型的智能本质

诺奖得主 Demis Hassabis教皇科学院开讲：AI 是一项令人难以置信的技术，发展模式需重新思考

性能提升在即！吴恩达谈 LLM 新方向：优化智能体工作流

模拟到现实无缝转换！麻省理工学院研究团队提出生成模型LucidSim，破解机器人训练难题！

人形机器人的兴起

Grok-3 与黎曼猜想：人工智能带来的震撼与挑战

斯坦福伯克利重磅发现DNA Scaling Law，Evo荣登Science封面！AI设计DNA/RNA/蛋白质再突破

AI 求解量子多体问题：GPT 理解人类语言，也理解量子语言吗？

真的撞墙？OpenAI 的任务对齐主管：2025年AI会在高阶应用突破，但一般人会感觉停滞

transformer的细节到底是怎么样的？Transformer 连环18问！

牛津大学报告：《无法被AI取代的力量：人类认知的理论驱动力》

吴恩达最新观点：LLM的下一个新兴方向是Agentic AI

Stephen Wolfram与计算的未来：一本带你认识世界的新书

研究人员发明了一种新的逻辑系统，有望提升批判性思维和人工智能的能力

马斯克新官上任再起诉OpenAI！新证据称Ilya七年前就不放心奥特曼了

OpenAI首位投资者《时代》刊文：AI将重新定义「人类的意义」

复旦大学：2024大语言模型的能力边界与发展思考报告

Anthropic创始人访谈：不是因为Altman 与微软合作而离开OpenAI、Scaling Law不会撞墙、未来招聘将放缓

生命的公式？新模型计算了宇宙中及宇宙之外存在智慧生物的可能性

MIT对大模型数理原理的强有力证明

智能时代：大统一理论与万物理论的追求、挑战与突破

黄仁勋对话孙正义：日本的AI新饼、Arm的AI野心与英伟达的东亚新机会

AI寒冬真的要来了！Ilya：I told you so

WHALE来了，南大周志华团队做出更强泛化的世界模型

李彦宏：智能体是AI应用最主流形态，即将迎来爆发点｜百度世界2024

奥特曼专访自曝：OpenAI将实现AGI第三级，一人也能打造10亿独角兽

开源的定义要变了！开源AI标准成照妖镜：Meta、谷歌家大模型只是在假装开源？

Scaling Law撞墙，AI圈炸锅了！OpenAI旗舰Orion被曝遭遇瓶颈，大改技术路线

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉