极客说｜多智能体时代

文摘 2024-12-12 09:13 河北

作者：魏新宇 - 微软 AI 全球黑带高级技术专家

排版：Alan Wang

「极客说」是一档专注 AI 时代开发者分享的专栏，我们邀请来自微软以及技术社区专家，带来最前沿的技术干货与实践经验。在这里，您将看到深度教程、最佳实践和创新解决方案。关注「极客说」，与行业顶尖专家一起探索科技的无限可能！投稿请联系：17278094563（微信号）

本文涉及到的详细测试代码和测试步骤放置于：

https://github.com/xinyuwei-david/david-share/tree/master/LLMs/Magentic-One

本文中不再赘述代码实现。欢迎给 repo 点亮 Star，您的点赞是作者持续创作的动力。

近年来，生成式人工智能领域掀起了一股“多智能体”（Multi-AI Agent）热潮，各大科技巨头纷纷推出了自己的多智能体框架。这些框架如雨后春笋般涌现，包括微软的 AutoGen 和最新的 Magentic-One、OpenAI 的Swarm、LangChain 的 LangGraph 以及 CrewAI 等。然而，面对琳琅满目的选择，开发者们难免犯难：究竟哪一个多智能体框架才是最适合自己的？为了帮助大家解开这个疑惑，本文将深入解析这些主流的多智能体框架，详细介绍它们的特点、优势与不足，并结合实例，为您在选择和应用时提供有价值的参考。

AutoGen（微软）

框架简介

AutoGen 由微软推出，最初主要面向软件开发任务。它采用了用户代理（User Agent）和助理代理（Assistant Agent）的双代理模式，为代码生成和执行提供强大的支持。

核心特点

双代理交互机制：用户代理负责提供需求或提示，助理代理则根据这些需求生成并执行代码。
代码生成与执行一体化：助理代理不仅能够生成代码，还可以直接执行，并将结果反馈给用户或其他代理。
人性化的指导：在代理交互过程中，允许人类介入，提供指导或调整方向。
强大的社区支持：得益于微软的资源和影响力，AutoGen 拥有活跃的社区和丰富的资源。

优势解析

专业性强：高度适合复杂的软件开发和代码生成任务。
扩展性好：方便定制和扩展，满足特定需求。
资源丰富：大量的示例、文档和社区支持，降低了上手难度。

不足之处

学习门槛较高：对于非程序员或编程经验不足的用户，可能不够友好。
配置复杂：尤其是在使用本地大型语言模型（LLM）时，需要进行复杂的设置，如配置代理服务器等。
领域局限：在非软件开发任务中，性能和效果可能不尽如人意。

适用场景与实例

适用于需要复杂代码生成和多代理协作的软件开发任务。

实例

自动化代码审查系统：利用用户代理提交代码片段，助理代理进行代码审查、优化并返回改进建议。
多模块协同开发：在大型软件项目中，不同的助理代理负责不同模块的开发和测试，用户代理协调整体进度。

CrewAI

框架简介

CrewAI 以其直观、易用的特点成为许多开发者快速构建多智能体演示的首选。即使是非技术人员，也能在短时间内创建出功能丰富的多智能体系统。

核心特点

基于提示的简单操作：主要通过编写提示来控制代理行为，学习成本低。
高效的代理创建：能够在数分钟内创建上百个代理，实现规模化。
广泛的 LLM 支持：通过与 LangChain 的集成，兼容大多数 LLM 提供商和本地 LLM。

优势解析

易上手：对编程知识要求低，适合初学者和非技术人员。
快速开发：非常适合需要快速构建原型或演示的场合。
灵活性：在一定范围内，可以方便地定制代理的行为和属性。

不足之处

功能深度有限：在处理复杂的编程或逻辑任务时，能力可能不足。
交互不稳定：代理之间的交互有时可能出现Bug，影响体验。
社区资源有限：相比其他框架，CrewAI 的文档和社区支持较少。

适用场景与实例

适用于需要快速搭建、演示多智能体系统的场合，特别适合非技术用户。

实例

客户服务代理团队：快速创建多个代理，分别负责解答不同类型的客户问题，提升客服效率。
市场调研助手：代理们协作收集、整理市场信息，为决策提供支持。

LangGraph（基于 LangChain）

框架简介

LangGraph 是基于 LangChain 构建的多智能体框架，以其高度的灵活性和可定制性著称。对于需要复杂逻辑和自定义的开发者来说，LangGraph 无疑是最佳选择。

核心特点

有向循环图结构：基于有向循环图（Directed Cyclic Graph），能够清晰地表示代理之间复杂的依赖关系和交互流程。
强大的扩展能力：支持几乎任何类型的多代理编排应用，满足高度定制化需求。
丰富的社区资源：作为 LangChain 的扩展部分，享有其活跃的社区和大量资源。
广泛的 LLM 兼容性：与开源 LLM 和各种 API 接口良好兼容，提供更多选择。

优势解析

高度可定制：开发者可以根据需求，自由设计代理的逻辑和交互方式。
支持复杂任务：适合需要复杂逻辑处理、多步骤协作的任务场景。
社区支持：大量的示例、文档和社区讨论，帮助开发者快速解决问题。

不足之处

学习曲线陡峭：需要开发者具备较强的编程能力，对图结构和逻辑流有深入理解。
文档有待完善：目前的文档可能不足以覆盖所有功能，需要开发者自行探索。
初学者不友好：对于编程新手，可能需要投入更多时间和精力。

适用场景与实例

适用于需要高度定制、复杂逻辑处理的多智能体系统，适合有经验的开发者。

实例

智能投顾系统：多个代理分别负责市场分析、风险评估、策略制定，为用户提供个性化的投资建议。
科研辅助平台：代理团队协作，从文献检索、数据分析到报告撰写，支持整个科研流程。

OpenAI Swarm

框架简介

OpenAI 推出的 Swarm 是一款面向新手的多智能体框架，旨在以最简单的方式帮助用户入门多智能体系统的构建。

核心特点

简洁明了：专注于简化代理的创建和代理之间的上下文切换（称为“Handoffs”）。
快速上手：无需复杂的配置，即可开始构建多智能体系统。
专注于演示：非常适合用于创建简短的演示或概念验证。

优势解析

用户友好：界面和操作简洁，降低了入门门槛。
快速构建：适合需要在短时间内展示多智能体概念的场合。

不足之处

兼容性受限：目前仅支持 OpenAI 的 API，无法使用其他 LLM。
功能有限：不适合用于生产环境，缺乏必要的扩展性和稳定性。
社区支持不足：资源和支持较少，遇到问题可能难以及时解决。

适用场景与实例

适用于多智能体系统的新手用户，或需要快速创建演示的场合。

实例

教学辅助工具：创建简单的代理，帮助学生理解基本概念或解答简单问题。
基础问答系统：搭建一个简单的问答平台，代理之间进行基本的信息传递和协作。

Magentic-One（微软）

框架简介

作为微软最新推出的多智能体框架，Magentic-One 是在 AutoGen 的基础上进行的简化和优化，旨在降低使用门槛，让更多用户能够方便地构建多智能体系统。

核心特点

预配置的代理集合：框架内置了一个协调者代理（Orchestrator）和四个功能代理：

WebSurfer：浏览和交互网页内容。
FileSurfer：管理和访问本地文件。
Coder：专注于代码编写和分析。
ComputerTerminal：提供命令行接口，执行程序和安装库。

基于 AutoGen：继承了 AutoGen 的优势，同时简化了操作。
性能分析工具：集成了 AutoGenBench，用于评估代理的性能和效率。

优势解析

开箱即用：预设的代理和功能，无需复杂配置，节省时间和精力。
用户友好：界面直观，适合非技术人员使用。
性能可视化：通过性能分析工具，直观了解代理的运行情况，方便优化。

不足之处

兼容性问题：在集成本地或开源 LLM 时，需要额外的配置和调整。

适用场景与实例

适用于希望快速搭建通用型多智能体系统的用户，特别是对技术要求不高的场合。

实例

信息整合平台：利用内置的代理，完成从网络信息收集、文件管理到代码处理的全流程操作。
自动化系统运维：通过 ComputerTerminal 代理，执行系统命令，管理服务器和应用。

总结

整体最强大和全面的框架：如果您追求功能深度和专业性，AutoGen 可能是最佳选择。
快速开发和易用性：如果您重视上手速度和简便性，CrewAI 是理想的选择。
高度定制和复杂逻辑：需要深入定制和复杂功能时，选择 LangGraph。
成本效益和通用性：希望快速部署通用解决方案，Magentic-One 会是不错的选择。

魏新宇

微软 AI 全球黑带高级技术专家

著有《大语言模型原理、训练及应用》《金融级 IT 架构与运维》《OpenShift 在企业中的实践》v1&v2、《云原生应用构建》。

END

AIGC开放社区

专注AIGC领域的专业社区，关注微软OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

最新文章

所有用户无限用Sora，OpenAI放圣诞福利！

极限压缩380倍！比OpenAI的Whisper更高效，开源模型超2000颗星

OpenAI 12天直播大盘点！o3、Sora，一次看完所有新技术

AI工具 | AI商品图工具合集

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

函子科技CEO蒋耀锴，将出席“ISIG-AIGC多模态技术与应用峰会”

OpenAI甩王炸！发布新模型o3，一夜再次改变世界！

AI——有自由意志会怎样？

AI大模型/AIGC多模态/RPA超级自动化/低代码四大科技峰会来袭！

集思科技销售VP陈曙光，将出席“ISIG-AIGC多模态技术与应用峰会”

讯飞机器人超脑平台总经理刘可为，将出席“ISIG-AI大模型技术与应用发展峰会”

谷歌版o1模型发布：霸榜排名第一，深度展示思维链

ChatGPT重磅功能！支持AI Agent玩法，OpenAI加入智能体了

苹果正与腾讯、字节跳动洽谈，在iPhone集成类ChatGPT

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

聚力维度创始人&CEO赵天奇，将出席“ISIG-AIGC多模态技术与应用峰会”

AI核心技术，颠覆传统数据整合模式！全球数据管理领导者Denodo技术干货分享来啦~

微软全球黑带技术专家武帅，将出席“ISIG-AI大模型技术与应用发展峰会”

OpenAI整大活！ChatGPT新增电话功能，全民AGI要来了

开个AI局，探索大模型的无限可能！AI大模型技术与应用发展峰会火热报名中~

重磅来袭！HealthAI 2024健康智能挑战赛启动报名

英伟达发布微型大模型计算机，每秒计算67万亿次

达观数据联合创始人张健，将出席“ISIG-AI大模型技术与应用发展峰会”

壹沓科技大模型产品总监王琰元，将出席“ISIG-AI大模型技术与应用发展峰会”

重磅！OpenAI开放满血o1模型API，成本暴降60%

开启智能之旅！RPA超级自动化与流程挖掘峰会火热报名中~

Liquid AI获2.5亿美元融资，创新液态大模型

ChatGPT搜索大更新！实时搜索、高级语音，AI搜索时代来了

AI工具 | AI内容检测合集

AI加速，码力全开！低代码/零代码技术与应用发展峰会火热报名中~

超过Sora！谷歌发布Veo 2，支持4K、逼真到难以分辨

开个AI局，探索大模型的无限可能！AI大模型技术与应用发展峰会火热报名中~

多模态解锁无限可能！AIGC多模态技术与应用峰会火热报名中~

微软发布Phi-4，最强小模型！参数极小、超GPT-4o

IBM推出化学大模型：可精准预测分子性质和行为

突破性功能！OpenAI发布ChatGPT Projects，万能工具箱上线！

AI核心技术，颠覆传统数据整合模式！全球数据管理领导者Denodo技术干货分享来啦~

微软 Azure AI 荣耀登榜，2024最受开发者欢迎的 AI 应用开发平台！

极客说｜深度对比：SFT、ReFT、RHLF、RLAIF、DPO、PPO

AI现身2024国际象棋世界冠军赛！世界棋王丁立人守擂，看AI如何让国际象棋更有趣

重磅！ChatGPT解锁高级视频对话、屏幕共享，实时交互时代

ISIG年度盛会来袭！RPA/低代码/AI大模型/AIGC多模态四大科技峰会共掀数字化创新浪潮

AI Agent成主打！谷歌发布超强多模态大模型—Gemini 2.0

极客说｜多智能体时代

王者降临！苹果全家桶接入ChatGPT，重塑iPhone、iPad 、Siri

多模态解锁无限可能！AIGC多模态技术与应用峰会报名开启~

人人可用，AI Copilot 场景学习资料大放送！

史上最贵！首个AI Agent程序员商业化，比ChatGPT Pro贵2倍

突发！OpenAI发布Canvas，ChatGPT新增史诗级功能

AI应用 | 可口可乐AI广告惹争议

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉