GenAI的新潮流:如何利用智能体的力量

科技   2024-08-19 16:55   北京  
点击上方“蓝色字体”,选择 “设为星标

关键讯息,D1时间送达!



本文探讨了GenAI智能体的概念及其在克服当前大型语言模型局限性方面的潜力。通过结合规划、记忆和工具等关键组件,这些智能体能够执行复杂任务,并在最少人工干预下实现高度自动化。智能体设计模式如反思和多智能体协作进一步增强了其任务执行能力。展望未来,GenAI智能体将与人类协作,共同推动科学发现、艺术创作及商业运营的创新与进步,为企业带来前所未有的战略优势和效率提升。


AI和机器学习的发展历程是颠覆性的。最初,我们从手动编码转向通过数据训练计算机。在早期阶段,AI只能处理特定任务,例如分类和物体识别——这些是它们经过明确训练后能够执行的功能。

但这一切在2022年底随着OpenAI推出ChatGPT而发生了改变,这一突破性工具不仅可以生成内容,还能执行各种任务,迅速吸引了全球数百万人的关注。正如Gartner在2023年AI技术成熟度曲线中所指出的那样,GenAI已经达到了“膨胀期的顶峰”,预计将在未来5到10年内进入“生产力平台期”。

克服挑战与局限性


根据Gartner的定义,达到生产力平台期意味着AI将被广泛采用,其优势将得到明确定义,并有清晰的实施指南。要实现这一目标,我们首先必须解决当前AI技术的局限性,并探索如何通过智能体来克服这些挑战。

尽管当今的大型语言模型(LLMs)在生成电子邮件、写作文章和进行情感分析等任务上表现出色,但它们在处理复杂任务时仍然存在困难,例如复杂的数学计算或多步骤问题解决。此外,LLMs还存在其他显著的局限性:

• 幻觉或误导性输出
• 技术限制,如有限的上下文长度和内存
• 输出中的偏见
• 可能产生有害或不当言论
• 知识有限(例如,ChatGPT 3.5的知识截止日期为2021年9月)

有趣的是,这些挑战与我们人类所面临的问题并无太大不同。我们也容易犯错误、存在偏见、记忆有限,有时甚至会做出有害的回应。为了管理这些不足,我们通常会:

• 在线寻找信息,使用Excel和Word等工具。
• 多次修改我们的工作以纠正错误并提高质量。
• 寻求同事和导师的反馈,并吸收他们的见解。
• 团队合作以取得更好的结果。

通过应用类似的策略,我们可以改进大型语言模型(LLM)的输出,从而引出GenAI智能体的概念。

什么是GenAI智能体?


GenAI智能体旨在克服当前LLM的许多局限性,能够执行单一模型无法处理的复杂任务。例如,如果你想从一个数据集中识别出按收入排名前三的公司,智能体将会:

• 获取所有公司的收入数据。
• 按收入对公司进行排序。
• 返回排名前三的公司。

为了实现这一目标,智能体将LLM与关键组件结合起来,如规划、记忆和工具:

• 规划:智能体使用LLM制定并执行计划。
• 记忆:智能体在执行多个步骤时保留信息,从而能够处理复杂任务。
• 工具:智能体使用各种工具来执行特定任务,以下将对此进行更详细的讨论。

GenAI智能体的关键特性


GenAI智能体被设计为:

• 规划和执行任务
• 反思结果
• 使用工具实现特定目标
• 在最少的人工干预下运行

此类智能体的例子包括网站建设工具、从Excel表格中提供见解的数据分析师,以及根据用户输入规划旅行的旅游代理。

工具在GenAI智能体中的作用


工具对于智能体至关重要,使其能够有效地执行任务。在GenAI的领域中,工具使LLM智能体能够与外部环境和应用程序进行交互,例如进行互联网搜索、代码解释器和数学引擎等,这些工具可以访问数据库、知识库以及外部模型。

例如,一个旅行代理需要工具来搜索和预订航班,还需要搜索互联网的工具。其他工具可能包括:

• 实体提取:从非结构化文档中提取特定信息。
• Chat DB:无需SQL知识即可从数据库中检索信息。
• 知识机器人:使用检索增强生成(RAG)技术,根据自定义知识库回答问题。
• 互联网搜索:根据用户查询从搜索引擎获取内容。
• 摘要生成:为大型文档提供针对特定角色的摘要。
• 程序执行:执行Python代码以解决特定问题。
• 维基百科搜索:根据用户查询从维基百科检索内容。
• 比较:回答比较性问题,如性能指标或产品推荐。

智能体设计模式


为了执行复杂任务,智能体必须有效地协调这些工具。基于Andrew NG的讲座,已经出现了几种智能体设计模式:

• 反思:LLM评估自己的工作以改进输出。
• 工具使用:LLM利用工具,如网络搜索或代码执行,来收集信息和处理数据。
• 规划:LLM制定多步骤计划以实现目标,然后执行该计划。
• 多智能体协作:多个AI智能体协作,分配任务并讨论想法,以寻找更好的解决方案。

尽管前两种模式会产生可预测的结果,但后两种仍处于实验阶段。

LLM智能体框架


基于对智能体、工具和设计模式的理解,规划模式的一种变体逐渐形成。这个框架包括定义一个任务或目标,然后通过迭代的方式规划并执行下一个动作,接着进入反馈循环。

一个LLM智能体由核心组件组成:

• 大脑/LLM:作为协调者。
• 记忆(向量数据库):存储中间步骤和结果。
短期记忆:在上下文窗口内保存上下文信息。
长期记忆:一个外部的向量存储,提供相关的上下文信息。
• 工具/互联网:使智能体能够执行任务,如网络搜索或程序执行。
• 政策:通过设计确保信任,防止处理有害输入。

智能体的未来


GenAI的未来在于智能体与人类的协作。试想一个世界,医生、设计师和客户服务代表都由增强其能力的智能体支持。从科学发现到艺术创作,可能性是无穷的。

对于企业而言,将GenAI智能体融入运营中可以带来战略优势,释放出新的效率提升、个性化服务和问题解决能力,这些智能体不会取代人类的创造力,而是会增强它,推动一个充满创新和进步的未来。



版权声明:本文为企业网D1Net编译,转载需在文章开头注明出处为:企业网D1Net,如果不注明出处,企业网D1Net将保留追究其法律责任的权利。


(来源:企业网D1Net)





关于企业网D1net(www.d1net.com)




国内主流的to B IT门户,同时在运营国内最大的甲方CIO专家库和智力输出及社交平台-信众智(www.cioall.com)。旗下运营19个IT行业公众号(微信搜索D1net即可关注)



如果您在企业IT、网络、通信行业的某一领域工作,并希望分享观点,欢迎给企业网D1Net投稿。封面图片来源于摄图网

投稿邮箱:

editor@d1net.com

合作电话:

010-58221588(北京公司)

021-51701588(上海公司) 

合作邮箱:

Sales@d1net.com


企业网D1net旗下信众智是CIO(首席信息官)的专家库和智力输出及资源分享平台,有五万多CIO专家,也是目前最大的CIO社交平台。


信众智对接CIO为CIO服务,提供数字化升级转型方面的咨询、培训、需求对接等落地实战的服务。也是国内最早的toB共享经济平台。同时提供猎头,选型点评,IT部门业绩宣传等服务。

扫描 二维码 可以查看更多详情

AI人工智能D1net
企业网D1Net-国内精准专业的企业IT媒体。涵盖:云计算;智慧城市;数据中心;大数据;物联网;BYOD;企业移动应用;服务器;存储;虚拟化;安全;企业应用软件;UC协作;视频会议;视频监控;呼叫中心;运营商企业业务;IT咨询;渠道等。
 最新文章