在当前大模型Scaling Law 效应逐渐放缓的背景下,全球人工智能(AI)巨头纷纷将研发重心转向AI Agent 技术。近日,OpenAI CEO Sam Altman 在公开场合透露,今年晚些时候将发布“非常出色的新版本”,并暗示AI Agent 或成为下一次重大技术突破。
具体而言,由于大模型技术发展遭遇瓶颈,OpenAI 正在秘密研发一款名为“Operator”的AI 代理工具。这款工具的定位远超传统聊天机器人,可充当用户的智能私人助手,帮助完成诸如编写代码、订购机票、处理邮件、安排日程等各类计算机任务。据悉,该工具计划于明年1月推出研究预览版,首先向开发者开放,并通过API 接口提供服务。这一布局不仅展示了OpenAI 的技术战略转型,也折射出整个行业的趋势。
事实上,AI Agent 技术已成为当前AI 领域的热点。Anthropic 和微软近期均发布了类似的 AI 代理工具,旨在让AI 直接操作计算机完成复杂任务。同时,谷歌也在紧锣密鼓地研发代号为“Jarvis”的AI 代理系统。各大科技公司在这一领域的激烈竞争预示着AI Agent 或将成为未来人工智能发展的重要风口。
近日,百度文心智能体技术获得2024世界互联网大会领先科技奖,在颁奖典礼上,百度首席技术官王海峰指出,“以大模型为代表的人工智能技术正在引领科技创新和产业变革浪潮,而智能体是当前最能激发大模型潜力的应用方向。”
他进一步介绍到“文心智能体技术,受到人脑快思考慢思考的启发,在基础大模型之上研制了基于思考模型的慢思考机制,更理性、更准确。思考模型,通过思考过程的有监督精调、行为决策的偏好学习、结果反思的增强学习等思考增强训练,具备理解、规划、反思与进化能力,一定程度上将思考过程白盒化,从而让机器像人一样思考和行动,自主完成复杂任务,并在环境中持续学习自主进化。”
今年9月,OpenAI震撼发布了o1 系列大模型,引起了新的AI技术浪潮。o1 上线之后, ChatGPT 可以在回答问题前先仔细思考,就像人类大脑的系统 1 和系统 2,ChatGPT 已经从仅使用系统 1(快速、自动、直观、易出错)进化到了可使用系统 2 思维(缓慢、深思熟虑、有意识、可靠),这让它能够解决以前无法解决的问题。
而早在去年10月,百度就已经对慢思考机制的产生进行了说明,受《思考,快与慢》一书启发,研制了智能体机制。在基础大模型的基础上,又进一步研制了反应慢但更理性、更准确的“系统2”。
今年以来,李彦宏也多次预见性的指出:智能体是大模型未来发展的关键方向,虽然这一点还没有在业界形成共识。李彦宏进一步解释了大模型发展的几个阶段。最初,大模型主要是作为人类的辅助工具,最终输出的内容仍需要人类审核与把关,确保其质量,这是“Copilot”阶段(AI辅助人类);接下来则是“Agent智能体”阶段。关于Agent的定义,外界有许多不同的说法,但核心在于它具备一定的自主性,能够自主使用工具、反思和自我进化;当自动化程度进一步提升,就进入“AI Worker”阶段,智能体将像人一样能够独立完成各种脑力和体力工作。这一发展路径是大模型领域不可或缺的进程。
LangChain 在2024年11月发布的《AI Agents 现状报告》中也揭示了AI 智能体应用的爆炸性增长,超过 50% 的企业已将 AI 智能体投入生产,78% 的企业计划部署 AI 智能体。虽然性能质量仍然是最大的挑战,但AI 智能体在研究、生产力提升和客户服务等领域展现出巨大潜力。报告强调安全控制和可观测性的重要性,并预测开源和更强大的模型将推动AI 智能体技术的未来发展。
AI智能体的发展正揭示人工智能技术的新方向。在大模型技术扩展受限的背景下,AI智能体凭借其自主性和任务完成能力,成为全球科技巨头的研发重点。从OpenAI的“Operator”到百度的文心智能体,各大企业正致力于构建具备理解、规划、反思与进化能力的智能体技术,以激发大模型的潜力。随着技术的成熟,AI将逐步从“Copilot”阶段迈向“Agent”阶段,最终进入“AI Worker”阶段,实现从辅助工具到自主工作的跃升。这一趋势不仅推动了人工智能的全新突破,也为行业未来发展带来无限可能。AI智能体的崛起,或将开启人工智能的下一个黄金时代。
作者:刘锋
阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”
截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告
上下滑动查看更多