一些智能体开发的认识

创业   2024-12-02 21:24   北京  

文:王智远 | ID:Z201440

AI Agents平台,不知道咱俩理解的一样吗?

我的看法是这样的:
它像一个培养各种领域专家的地方。你给它数据,它能帮你记住,还能通过训练,培养出各种“专家”来解决不同领域的问题。
现在Agents比较火,前几天,还看到一个吐槽,大概意思是:以后要是对着手机说话,AI能帮我搞定一切就好了。
我觉得可能很快会实现。你看,最近智谱的 AutoGLM,只要说说话,就能帮你点杯咖啡。
还有华为Mate系列,只要在空中做抓取、释放的动作,就能把选中的图片传到另一个设备上。官方给它起了个名字叫“AI 隔空传送”。

这种交互方式的核心,是利用传感技术。通过识别手势动作,把这些动作变成节点,然后用工作流串联起来,实现无缝衔接的效果。

对于工作流(workflow),这个概念相信很多人并不陌生,但是,为什么这两年却成为焦点了呢?核心原因有两个:

一是自动化。工作流能自动处理很多任务,不用人一直盯着;二是效率高,错误少。自动化处理让工作更快,出错的机会也小了。
说到底,工作流就是让人从重复的工作里解放出来,去做更有创意、更有价值的事。
那怎么掌握工作流呢?
一,得会拆任务。就像把大象放进冰箱一样,把大任务拆成一步步的小步骤;二,得会用工作流平台,把步骤变成动作,让电脑自动完成。
前者不用多说,后者的难点在于怎么操作。比如,怎么在平台上搭建这些动作?
而这些东西就要从基础方面入手。在深入了解智能体之前,我有必要先说说, Chatbot 和 AI Agent 的区别,这是理解工作流的一个部分。
Chatbot,简单讲,聊天机器人、能跟人聊天的工具。早些年,它的功能很简单,就是回答一些预设好的问题。
Chatbot 的历史不复杂,早期,它就像一段固定的代码,问点超出范围的问题,它就答不上来了。
后来,随着人工智能和自然语言处理技术的进步,聊天机器人越来越聪明。这时,人们开始提到 AI Agent。
Chatbot 和 AI Agent 的区别,简单来说,AI Agent 能干的事更多,不仅能聊天,还能帮你订服务、管理日程,甚至用手机下单。
虽然听起来像是两个完全不同的东西,但实际上,AI Agent 就是 Chatbot 的升级版。本质上,它们都是人工智能工具。
只不过,AI Agent 功能更强大、更灵活,更适合现在的复杂需求。
所以,Chatbot 和 AI Agent 都是人工智能工具,只是后者功能更多、更先进,了解这点,有助于我们理解它们的实际用途。
刚才说了第一点关于 Chatbot 和 AI Agent的区别,第二点是什么?我觉得是对智能体平台的分类与理解。智能体平台有很多种类,但总的来说,可以分成四种:
  • 给普通人用的

  • 服务技术开发者的

  • 服务于企业的

  • 基于托管服务的综合平台
对于第一种,这类平台特别友好,操作简单,哪怕是没有技术背景的人也可以轻松上手。
比如:腾讯元宝、讯飞星火、文小言等APP的智能体广场,只需上传一个名字、头像和提示词,再选择一个声音,就能快速创建一个智能体。
整个过程傻瓜式操作,无需懂任何复杂的参数设置。
它们的优势是什么?低门槛、场景细分化。普通人可以使用不同对话场景,平台也能通过这些智能体收集对话数据,为将来的模型优化做准备。不过,这种智能体目前主要还是个人体验,深度功能有限。
第二类平台,是为开发者定制的。比如:百度、阿里、腾讯等公司提供的智能体开发环境。
它们通常将 API、代码库、参数配置等整合到一个统一的平台中,开发者可以通过这些工具,从数据接入到智能体构建,全流程快速完成。
扣子、Dify.AI、昆仑万维的天工 SkyAgents、百度云的千帆AppBuilder 等,都是这一类平台的典型代表。
为什么这种平台很重要呢?
一个原因是:灵活性与可定制性。它们为技术开发者提供了极大的自由度,无论是为中小企业开发简单的助手,还是为特定行业设计复杂的智能体,开发者都可以根据实际需求灵活调整。
我观察到,这些平台功能正在逐步演进。
以前,开发者更多利用它们来制作一些简单的工具,现在,很多开发者开始用这些平台创建针对行业需求的智能体,解决更具体、更复杂的问题。
企业级开发平台,可以理解为“智能体的基础设施”。这些平台提供了一个全套的开发环境,从模型托管到任务处理,一条龙服务都能覆盖。
例如:
华为云的 ModelArts、亚马逊的 Bedrock Agents、阿里的 ModelScope-Agents;它们的共同点是,开发者或企业不用从零开始,可以直接用平台的服务快速开发和部署智能体。

这种托管平台的好处是,降低了开发难度,缩短了开发时间。对于想快速推出 AI 应用的企业来说,这是个高效的选择。

了解完智能体平台四种类型后,再深入看看在实际场景里怎么用。

先来说说聊天智能体。不要以为智能体只会聊天,它的应用远比表面看起来更丰富。从功能和场景来看,可以大致分为三个类别:
第一类,基础知识库驱动型。这种智能体用平台自带的知识库,操作简单,适合个人用户。就像我之前提到的腾讯元宝、讯飞星火、文小言的智能体广场。
这种智能体功能虽然不多,但可以试不同的对话场景,或者用来娱乐,满足一些轻松的需求。
第二类,更符合企业的定制需求。这些智能体通常利用平台的能力,为企业量身定制。
比如:
有的公司想在淘宝上弄个聊天助手,他们就得用阿里的聊天机器人;有的企业想在百度上做运营,就得用百度UNIT来实现。
如果主要依赖微信生态,那么腾讯云的智能对话平台可能更合适。还有像智齿科技这样的服务商,专门为电商场景提供客服解决方案,也是不错的选择。
这种智能体主要用于对话咨询、产品介绍或快速回答问题等场景。
第三类,是大模型流行后的知识库+智能体+工作流的组合。这种智能体可以说是升级版的聊天机器人,能根据企业自己的数据(FAQ、知识库)回答问题,还能通过大模型的能力,生成更自然的对话内容。
一个例子是:BetterYeah AI Agent(斑头雁)。
这个公司的老板是原钉钉副总裁张毅,他以前在阿里搞无线技术和企业产品,主要负责收集考勤数据、审批流程,还有智能人事管理。
为啥提这个公司呢?想想钉钉是怎么发展起来的,它最开始做考勤,从一个不起眼的小技术公司,做到了SaaS服务,最后连硬件都做起来了。
张毅对企业用户的需求看得很清楚,他能从最基本的需求出发,所以,他2023年出来创业做AI Agent,肯定是看中了智能体平台在某些方面的优势。
BetterYeah AI Agent有三个产品,我看了一下,Agent这个产品主要是给企业用的,帮助企业在客服、营销和销售方面用上人工智能。
知识库产品,能帮助企业建立自己的AI知识库,从搭建、训练,到智能客服系统的本地安装;工作流这个产品,是让企业能自己打造AI智能体的,还能让知识库和不同的平台连接起来。
这三个产品结合起来,就形成了一个完整的闭环,这就是聊天型智能体在实际业务中的刚需场景。

如果说聊天型智能体解决人与智能的沟通问题,那么,专门处理业务的智能体,它们能深入企业的复杂流程,像专业的助手和流程优化器一样。

比如说:在银行,如果有人想贷款,审核流程特别麻烦,得好几个部门一起弄。
要是用智能体平台做个贷款助手,帮客户准备材料,自动出个初步评估报告,把流程分给不同的部门处理,最后告诉客户结果,这就是专门针对某个行业的任务和复杂的业务场景。
那么,怎么用智能体平台实现这些流程呢?
关键是用不同的功能接口。比如,在材料收集阶段,客户在H5表单上填信息,后台通过表单管理服务,把数据存进数据库。
接下来是生成评估报告阶段。系统用一个大语言模型,分析数据后生成报告。到了流程分发阶段,系统用工作流引擎,比如BPM系统,把任务自动分配给不同的部门处理。
等所有流程完成后,结果反馈阶段就开始了。系统可能会用短信接口或邮件服务,把审批结果通知客户。
这就是针对复杂流程、复杂场景的工作流。
现在,我看到扣子、天工SkyAgents这些平台能调动的三方插件、模型越来越多,这说明轻量级的智能体走进中小公司的可能性提高了。
和聊天智能体比,这类智能体的特点是,一是能灵活整合工具和接口,二是针对具体需求:专注行业痛点,帮助企业解决复杂任务。
随着平台能力越来越强,我相信,轻量级的智能体会慢慢走进中小公司,成为它们优化流程、提升效率的好帮手。

最后一种是RPA和AI智能体。什么是 RPA 和 AI?

简单来说,RPA是机器人流程自动化,它是专门处理重复性任务的工具。
比如复制、粘贴、填表这些机械动作;当RPA加上AI技术,它就能处理更复杂的任务,还能学习新东西,适应新情况。
有人可能会问:RPA 和 AI 与集成工作流有什么区别?
可以这样理解:
集成工作流就像一个大平台,用来整合和调整各种流程,把不同的工具和接口连起来,让整个系统更灵活、效率更高。它主要是帮助跨部门合作和优化流程。
而RPA和AI智能体,更适合处理固定套路的重复动作。
比如:在电商行业,订单录入时,RPA能从表格里抓数据,直接填进系统,不用人动手;在库存管理上,RPA会定时检查库存,更新数据,甚至自动补货。
这些任务没啥创意,但对企业来说特别重要。用RPA智能体,企业能省人力,还能提高准确性。
目前我看到一些专注 RPA 的平台,比如:来也科技(UIBot)、弘玑信息(Cyclone Robotics)、金智维(K-RPA)等,已经在这一领域提供了成熟的解决方案。
它们加上AI的能力,让RPA不只是做简单操作,还能处理复杂的业务逻辑。所以,RPA和AI智能体的核心价值就是“自动化重复劳动”。
这就是智能体的集中区别。聊天型、针对具体业务场景型、集成工作流型,还有RPA加AI型;搞清楚这些,能帮我们在实际应用中,起到事半功倍的效果。

————

推荐阅读:
1.《Perplexity要进军企业RAG?
2.Kimi探索版不好用的原因找到了
长按识别下方图片
加入MANDUN星球,同时可加入智远的付费社群

觉得有价值,欢迎点个在看,每个人都应该拥有独立思考的能力,舍满取半,欢迎分享给更多人。

王智远
商业记录者,主持人、《复利思维》《自醒》图书作者;专注于市场营销、消费心理、AI新科技、精神生活与商业探索。
 最新文章