点击上方蓝色字“越山集” >右上角...>设为星标 ⭐
智能体这个概念其实很广,小到一个翻译插件,大到企业的智能客服系统,都可以是智能体。不同的人群,根据不同的目标,所需要了解和掌握的智能体实践知识也不尽相同。为了有个全景图,今天给大家粗略介绍下热心的智能体平台,以及一些框架和工具。
涉及扣子、元器、文心智能体、Dify、FastGPT、AutoGen、 LangChain、 Phidata等。
低代码智能体平台
现在多数人接触到的,是各家大厂推出的低代码智能体平台,比如字节的扣子,腾讯的元器,百度的文心智能体,阿里的飞书工作流等。
扣子Coze
https://coze.cn
国内目前最流行,功能完备,易于集成,也是最容易上手的智能体平台。
扣子Coze字节跳动推出的低代码智能体平台,一个强大而友好的AI应用开发平台,无论你是编程新手还是资深开发者,都能轻松上手。它以有下特点:
无需编程基础:通过可视化配置,快速搭建AI应用。 多模型支持:支持国内外顶尖大语言模型,如云雀、豆包、Moonshot、ChatGLM、通义千问、百川等。 丰富的插件系统:集成几百种插件,覆盖新闻、旅行、生产力等多个领域。 知识库和长期记忆:让AI机器人访问和交互所需的数据,具备长期记忆功能。 多平台发布:支持将机器人发布到不同的平台和API,如微信,飞书,掘金等。
这里说的是扣子国内版,它的海外版支持GPT-4等海外大模型(收费)。国内版也分普通版和专业版(收费)。
腾讯元器
https://yuanqi.tencent.com/
元器的核心优势是易于与微信生态集成。比如建一个根据公众号内容问答的机器人,就非常简单。
腾讯元器是腾讯推出的一款基于其混元大模型的AI智能体创作与分发平台。其通过低代码或无代码的方式,帮助用户快速创建智能体,实现聊天对话、内容创作、图像生成等功能。它有以下功能特点:
智能体商店:提供多种预构建的智能体,覆盖多种业务场景。 低代码开发:无需编写代码即可创建智能体,适合编程新手。 工作流模式:通过图形化界面设计工作流程,实现智能体的逻辑编排。 腾讯生态集成:与腾讯生态系统紧密集成,提供丰富的插件和工具。 全域分发支持:智能体可一键分发到腾讯多个平台,如QQ、微信客服等。 工具链支持:提供知识引擎、图像创作引擎等,扩展智能体的应用能力。
只能使用腾讯的混元大模型。如果需要与微信生态结合的智能体,元器应该是首选。
百度文心智能体
https://agents.baidu.com/
核心优势是与百度系产品结合,开发者创收友好的智能体创作平台。
文心智能体平台 AgentBuilder 是百度推出的基于文心大模型的智能体(Agent)平台,支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式,打造大模型时代的产品能力。开发者可以通过 prompt 编排的方式低成本开发智能体(Agent),同时,文心智能体平台还将为智能体(Agent)开发者提供相应的流量分发路径,完成商业闭环。
其功能特点包括:
低门槛开发:提供零代码、低代码开发模式,让没有编程背景的用户也能轻松创建智能体。 高效分发:依托百度生态,智能体可以通过百度搜索、小度智能硬件、文心一言等多个平台进行分发。 商业闭环:提供流量分发路径和商业机会,帮助开发者实现商业闭环。 免费使用:文心大模型4.0版本免费开放,提升了平台的能力边界。
文心智能体创作过程简单,只支持文心大模型,提供低门槛构建智能体的方式,适用于个人和小型企业。
百度除了文心智能体,还有百度千帆 AppBuilder。主要区别是 文心智能体面向C端用户,注重低门槛地构建智能体,以及智能体的流量分发(发布到百度的各种服务和平台上)。
而AppBuilder更侧重于企业级应用的开发,具备完善的 SDK、API 能力,并且可以引入外部接口。
私有化部署智能体平台
企业级AI应用,在搭建智能体的过程中,很可能需要 接入更多的大模型,或者数据只能在内网,希望有更强的定制能力, 那么选择私有化部署方案是合适的。
更强的扩展能力,更完备的控制,也意味着需要一定的IT开发能力。
下面介绍几个流行的,支持私有化部署的智能体开发平台。
Dify
https://dify.ai/zh
支持接入各种大模型,完美支持工作流,低代码搭建智能体,易与集成。
Dify智能体平台是一个开源的LLM(大型语言模型)应用开发平台,旨在简化和加速生成式AI应用的创建和部署。它结合了后端即服务(Backend as Service)和LLMOps(大型语言模型操作)的理念,为开发者提供了一个用户友好的界面和一系列强大的工具,使他们能够快速搭建生产级的AI应用。
它可以本地部署,也就是完全在内网或本地电脑上跑起来。创建的智能体配置信息支持导入导出。相比而言,所有大厂智能体都不支持导入导出,他们都有自己的智能体商店。
Dify也有云端版本,也可免部署,直接注册使用,类似前面的扣子。搭建界面和模型配置等还是很不一样,但都是低代码,容易上手。
Dify智能体平台的主要功能:
工作流构建:允许用户在画布上构建和测试功能强大的AI工作流程。 全面的模型支持:支持与数百种专有/开源LLMs无缝集成,包括GPT、Mistral、Llama3等。 Prompt IDE:提供直观的界面,用于制作提示词、比较模型性能。 RAG管道:支持从文档提取到检索的所有内容,包括从PDF、PPT等文档格式中提取文本。 Agent智能体:允许用户基于LLM函数调用或ReAct定义Agent,并集成预构建或自定义工具。 LLMOps:提供可观察性功能,用于监控和分析应用程序日志和性能。 后端即服务:为所有功能提供相应的API,可轻松集成到现有业务逻辑中。
Dify智能体平台适用于个人和小型企业,特别适合于需要快速搭建和部署AI应用的场景,如聊天机器人、智能客服、内容生成等。
FastGPT
https://tryfastgpt.ai/zh
优势是基于知识库问答类的AI应用,比如客服,教育等场景
FastGPT也是开源的LLM应用开发平台,专注于知识库问答。旨在通过自然语言处理技术,提供高效、准确的知识检索和问答服务。它支持多种数据导入方式,包括文档、图片等,并能够通过可视化界面进行工作流编排,实现复杂的问答场景。
FastGPT的主要功能
知识库构建:支持从文档、图片等多种数据源中自动提取和整合信息,生成语义丰富的知识库。 智能交互:支持自然语言对话,提供精准的用户体验。 自动化维护:实现数据的自动整合与更新,降低维护成本。 工作流编排:通过Flow可视化进行复杂问答场景的设计和管理。 API集成:支持与OpenAI官方接口对齐,方便集成到其他平台。
FastGPT内置一些知识库优化的方案,比如上传的文本内容,自动转换成QA对,提升回答准确率。处理效率高,减少人工干预,还能自动持续学习。
类似的基于文档问答的平台还有网易的QAnything, 开源的RAGFlow等,效果都还不错。
Agent开发框架
对于有较强开发能力的小伙伴来说,可以借助于一些强大的Agent框架,为企业定制开发出复杂的Agent应用。这里也一并简单介绍下,几个开源的,可完全定制的框架。
LangChain
LangChain是最流行的AI应用开发框架,支持Python, NodeJS。可以快速构建复杂的AI Agent,支持长时间运行和多步骤任务执行。
优势在于其灵活性和易于集成外部数据源,适合开发对话式AI助手和任务自动化系统; 劣势则在于对于初学者可能存在较陡的学习曲线,尤其是在工具链的配置上。
AutoGen Studio 2.0
AutoGen Studio 2.0是微软发布的开源框架,旨在简化高级AI Agent和多Agent系统的创建,强调模块化和可扩展性。
优势在于其高效构建复杂系统的能力和灵活的API设计; 劣势是相对较新的框架可能缺乏成熟的社区支持和文档资源
AutoGPT
AutoGPT是最早出现的自主Agent框架,能够执行复杂任务并进行自我迭代。它想实现的是让AI Agent完全自主地理解问题,规划任务,创建工作流,部署执行并监控。类似的框架还有BabyAGI, CrewAI等。越山会把它当作实验和学习Agent的框架。
优势在于其强大的自我学习能力和任务完成效率; 劣势则是可能需要大量计算资源,且在特定任务上可能不如专门化Agent灵活
Phidata
Phidata是一个专注于企业级应用的AI Agent框架,提供了长期记忆、上下文知识和函数调用能力。它可以将通用的大语言模型(LLM)转化为专门的助手,能够执行各种任务,如搜索网页、分析数据、撰写报告、回答问题等。上手相对容易。
优势在Phidata提供了一个完整的工具集,使得开发者可以轻松构建功能丰富的AI助手,适用于多种应用场景,如金融分析、数据查询等; 劣势是在处理复杂任务时,可能需要较高的计算资源,这对小型企业或个人开发者来说可能是一个负担。
本篇也收录在我们的小报童专栏 “AI智能体从入门到变现”,一本用心编写,详细介绍怎么搭建AI智能体的专栏。我们会持续更新它。
就酱,觉得有用的话,欢迎点赞点个“在看”。也欢迎加我好友, 交流, 围观, 学习。