首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

可信Agent构建之道：AI如何重塑工作流？

文摘 2024-08-07 09:03 湖北

用户体验代理，第二部分：环境型

❝
这是我们关于代理用户体验的第二篇文章。我们讨论了能够同时处理多项任务的环境型背景代理，以及它们如何融入您的工作流程。本系列合集，点击链接查看

在之前的博客文章中，我们探讨了基于聊天的代理用户体验，其中用户需要主动思考如何与AI进行交流。但如果AI能在后台默默为您工作，那会怎样呢？

我认为，为了让代理系统真正发挥潜力，我们需要转变观念，让AI在后台默默工作。当任务在后台处理时，用户通常更能接受较长的完成时间，因为他们对即时响应的期望降低了。这样，代理就能更自由地进行工作，往往比在聊天界面中更加细致和认真。

此外，让代理在后台运行，也使我们能够更有效地扩展我们的能力。聊天界面通常限制我们一次只能处理一个任务。但如果代理能在后台环境中运行，就可以有多个代理同时处理多个任务。

那么，这种后台代理的用户体验应该是什么样的呢？

编辑注：本文经翻译并二次整理自UX for Agents, Part 2: Ambient一文。

建立对后台代理的信任：从“人在循环中”到“人在循环上”

要让代理在后台运行，需要建立一定程度的信任。如何建立这种信任呢？

一个简单直接的方法是向用户展示代理正在做什么。展示它采取的所有步骤，并让用户能够观察整个过程。虽然这些信息可能不会立即显示（就像实时响应那样），但它应该可以让用户点击查看。

接下来，不仅要让用户看到发生了什么，还要让他们纠正代理。如果用户发现代理在10步中的第4步做出了错误的选择，他们应该能够回到第4步并进行某种方式的纠正。

这种纠正可以采取多种形式。让我们以一个具体的例子来说明，比如纠正一个错误调用工具的代理：

你可以手动输入正确的工具调用命令，让它看起来像是代理自己输出的，然后从那里继续执行。
你可以给代理明确的指示，告诉它如何更好地调用工具——比如，“使用参数X而不是参数Y”，然后让代理更新其预测。
你可以更新代理在特定时间点的指示或状态，然后从那个步骤重新开始执行。

选项2和3的区别在于代理是否意识到了自己的错误。在选项2中，代理面对自己之前的错误生成，并被要求进行纠正；而在选项3中，它并不知道自己的预测错误（只是简单地遵循了更新后的指示）。

这种方法将人类的角色从“在循环中”转变为“在循环上”。“在循环上”意味着能够向用户展示代理采取的所有中间步骤，允许用户在工作流程中途暂停，提供反馈，然后让代理继续执行。

一个已经实现了类似这种用户体验的应用是Devin，AI软件工程师。Devin可以长时间运行，但你可以看到所有采取的步骤，回溯到特定时间点的开发状态，并从那里进行纠正。

整合人类输入：代理在需要时如何寻求帮助

尽管代理可能在后台运行，但这并不意味着它需要完全独立地完成任务。总会有一些时刻，代理不知道该怎么做或如何回答。这时，它需要引起人类的注意并请求帮助。

以我正在构建的电子邮件助理代理为例。尽管电子邮件助理可以处理基本的邮件，但它经常需要我在某些任务上的输入，这些任务我不想自动化。这些任务包括审查复杂的LangChain错误报告，决定我是否参加会议等。

在这种情况下，电子邮件助理需要一种方式来告诉我它需要信息来响应。注意，它不是要求我直接回应；相反，它寻求我对某些任务的意见，然后它可以利用这些信息来制作和发送一封漂亮的电子邮件或安排日历邀请。

目前，我将这个助手设置在Slack上。它向我提出问题，我在线程中回应它，这样自然地融入了我的工作流程。如果我考虑这种类型的用户体验，而不仅仅是针对我自己的电子邮件助手，我会设想一个类似于客户支持仪表板的界面。这个界面将显示所有需要人类帮助的区域，请求的优先级，以及任何额外的元数据。

我最初用“代理收件箱”这个词来描述这个电子邮件助手 - 但更准确地说，它是一个人类协助代理完成某些任务的收件箱……这是一个有点令人不寒而栗的想法。

结论

我对环境型代理非常看好，因为我认为它们是让我们扩展自己能力的关键。

如果您正在使用环境型代理构建应用程序，请与我们联系。我们很乐意听听您的经验！

今天的内容就到这里，如果老铁觉得还行，可以来一波三连，感谢！

AI认知架构师，让我们一起用AI改变世界！

最新文章

LangChain 2024年人工智能发展报告

《一书解决几乎所有机器学习问题》.PDF下载

AI 打工我躺平｜大厂前端摸鱼指南

大模型面试实战！Prompt调优

改个名字，数倍提升Function Calling准确率！

如何生成Function Calling微调数据？

又一本开源免费的大模型书来了，449页pdf！

作为开发者，我如何提高任务型大模型应用的响应性能

总算有人把智能体记忆说清楚了

军用大模型现世，AI战争新时代

AI创造者计划,通义开启电影创作新时代

探索LLM推理全阶段的JSON格式输出限制方法

小米SU7智能举报不用等，我用智谱的GLM-4-Plus搞定了！

AI最大的应用是什么，如何成为初代AGI产品经理？

光与AI：视障玩家的《黑神话：悟空》挑战

必须为孩子存下来的提示词，像玩黑神话游戏一样学习

LangChain百万代码全解析：这个模型胃口很大！

可信Agent构建之道：AI如何重塑工作流？

AI界的新宠：揭秘Llama 3.1如何革新AI合成技术

LLM工具调用破局：Few-shot Prompting

如何改进Agents的推理与规划?

Agent智能体？我们要的到底是什么

难倒吴恩达的LLM评估，有解吗？

全新发布：LangGraph开启认知架构新纪元

探索GLM4-ALLTools：全能AI工具箱，释放开发者潜能

大模型能力分水岭数学考试，文心一言超gpt4o排名第一

吴恩达揭秘：编程Agent如何革新软件开发行业

全网爆火的AI狼人杀：开源了

Hugging Face全面拥抱LangChain：全新官方合作包

无需魔法,无需插件,国内网络即刻愉快的使用搭载GPT4的Newbing!

AI办公自动化｜使用New Bing和Python实现Word转Excel

无网络限制人人可用的ChatGPT-Claude

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉