对话聊天就是生成式AI最好的交互形态吗？不一定！

文摘 2024-07-11 10:48 北京

当下，以ChatGPT为代表的大模型AI应用都采用对话式的交互形态。各种各样的应用都被改造成自然对话的方式，LUI以及对话式的交互形态俨然已经成了是不是一个AI应用的标志。

那么，LUI就一定是最佳的形态吗？不一定，不可否认聊天的方式与大模型交互非常的自然，门槛也足够低，这对于一些目标清晰，步骤简单的任务非常有效。但是，遇到了一些复杂的，难以通过简单语言表达的复杂任务就很困难，想象一下，通过对话，让大模型生成一个业务流程Pipeline，这时候局限性就非常明显，用户拖拉拽就能搞定的事情，要通过对话来表达就相当考验人的表达能力和AI的理解能力。LUI的表现形式就一定是聊天方式（chat-based）最优吗？显然也不是。，比如想要 Midjourney,生成一副图片，也需要很高的提示技巧，而且这一过程是一个反复盲盒抽卡的对话过程，这一方面是受到了对模型控制能力的约束，另一方面就是我们现在讨论的主题。这样的局限性，任务也复杂，表现的也越明显。

有没有更好的交互方式突破这样的限制呢？国外有设计师Matthias Dittrich结合自己平日的工作体验和协作方式，提出了“人与AI协作”的交互方式[1]。如果把对话式看作是两个人“one-one”沟通解决问题，那么，这种协作模式就是两个人坐在一起，提供纸笔一起协作工作，一起探索方案，一起完善细节，大家能够在一个画布上进行编辑，互相都能看到它带来的影响。在无需大量语言沟通的情况下，就能够准确理解每一个过程和细节，最终共同完成一个复杂的任务。也许这时候你想到了“结对编程”，对，笔者觉得协作模式大体就是这样的。而“人与AI协作”便是将和你结对的人换成了AI，围绕这样的思想展开，就形成了这一交互模式的思想内核。下面是他对这一模式的更具体解释：

1. 提供持久的画布（工作区），共享持久的画布是”协作模式“关键特征。这个画布是一个可以更新的工作区，不需要在每次prompt时都重新渲染。用户应该能够了解所更改的内容，以评估更新是否符合预期。微软Copilot已经在使用类似的模式。AI就像真人助手一样坐在你身边，而画布（你的 Word 或 Excel 文档）则位于前方和中心位置。

2. 让用户对多个选项进行比较。通常从广义上开始创作过程，大多数人喜欢探索不同的方向--不仅是在设计屏幕时，在设计文字大纲或图表时也是如此。在探索过程中，需要比较不同的方向，考虑它们的优缺点。如果能在工具中直接进行比较，那有很大帮助。Midjourney 已经为每个请求提供了多个选项。不过，这些选项目前都是临时性的，或多或少会随着以下提示而被遗忘。

3. 提供手动添加或编辑的选项。通常情况下，自己进行一些更改比提示AI工具进行更新更容易。直接操作输出的能力能让用户更快、更精确地进行操作。Grammarly 就是一个很好的例子。虽然它也可以从头开始生成文案，但他主要用它来改进他已经写好的文本。在它更新后，可以继续编辑，这往往会导致多轮的来回修改。

4. 让用户能够完善细节特别是当你有一些特定的想法时，生成式AI就会变得很棘手。总有一些小细节与你的想法不同。重新渲染可能会解决当前的问题，但也可能产生新的问题。您可以事后在其他应用程序中调整这些问题，但您可能还想继续使用AI工具，这使得工作流程变得繁琐。特别是结合添加或编辑的功能，这将使许多 AI 工具变得更加精简和高效。Photoshops 的 AI 照片编辑器可以为选定区域生成新图像。它有助于处理构图的特定部分，从而逐层创建您想要的图像。

与其他新技术一样，设计师们已经做好了塑造这些工具的准备。对话类AI在处理一些复杂任务场景时，不必刻板模仿，可以考虑改变思维模式，从一对一聊天转变为协作画布。这可以消除许多障碍，让用户更精确、更高效。总的来讲，以人为本，结合真实场景体验，才能更好的发挥AI的价值。

参考：

[1]https://uxplanet.org/stop-designing-chat-based-ai-tools-f68aba9119b4

后台回复“进群”入群讨论。

AI工程化

专注于AI领域（大模型、MLOPS/LLMOPS 、AI应用开发、AI infra）前沿产品技术信息和实践经验分享。

最新文章

OpenAI前研究科学家开源面向未来的提示工程库 ell，重新定义提示工程

揭秘MemoRAG：AI记忆模块如何提升生成质量

Rerankers标准化重排序过程，一行代码就能拥有

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

长文本分块的新策略——后期分块（Late Chunking），让RAG应用"又准又高效"

编程表现比肩ChatGPT，这个新模型能力很强大

听说，那些效益好的企业都偷偷用了这个…

合成数据成为7B模型具备强大数学能力的关键

大模型的“记忆”不应仅仅只依靠向量数据库，mem0是一个很好的“融合架构”实践方向

突破：美AI安全研究所与Anthropic和OpenAI签署合作协议，推动AI安全新纪元

ChatGPT逆向工程后续：用v0 Chat和Cursor重塑前端开发流程，开启AI编程新纪元

用ChatGPT逆向工程压缩后的Js代码，表现惊艳

Cursor出彩的背后：“Prompt设计好比网页设计...”

大胆问，别尴尬，AI IDE（Cursor）可能比你想的强大（中外实际体验对比差距大【有视频】）

转型LLM应用开发推荐阅读——《从零构建向量数据库》，赠书活动又来了！

Weavel Ape超过DSPy，或将成为最好用的提示（prompt）优化工具

谷歌：Transformer在音乐推荐中的实践

大模型到底需要消耗多少GPU显存？公式和工具全都有

解读：Google前CEO施密特发言背后的心思和意思

仅用50行正则就能切分“任何文档”的精妙分词器，简单好用，性能强劲！

巨头谷歌为什么打不过OpenAI，谷歌前CEO说出了真相

全新GPT-4o mini发布！大模型杀疯了！

Gamma创始人畅谈现象级AI+PPT产品是怎么做出来的？

让Google大牛告诉你，他是如何使用LLM提升10倍效率的？

Google提出以人为中心的AI产品设计原则

OpenAI发布小更新！100%解决LLM应用开发Json结构化输出不稳定问题

互联网时代基础架构部的乱象，在AI时代还会出现吗？

Llamaindex推出workflow应对复杂LLM应用构建，以及技术实现从图（Graph）转向事件驱动（EDA）原因解析

Langchain发布官方Agent IDE，不同于Dify/Coze的设计理念，能否获得开发者认可？

高盛洞察：生成式AI：投入很高，收益太少？

零基础入门深度学习及大模型建模与应用的最佳路径（有书赠送）

一文详解模型权重存储新格式 Safetensors

新书推荐：零基础入门深度学习及大模型建模与应用（有赠书）

Meta 挖坑！Llama 祭出最严人工智能许可协议，模型开发者们要改名了

大模型的招投标订单都被谁拿走了？

重磅！Meta开源4050亿参数的大模型Llama3.1-405B！多项评测结果超GPT-4o和Claude3.5 Sonnet

10万级 H100 集群：能源、网络拓扑、以太网与 InfiniBand、可靠性、故障、检查点

应用开发范式或将改变！从全球首个Software2.0架构应用说起

RAG 应用落地常见的三个挑战及解决思路

Unstructured专家分享RAG应用中文档分块（chunking）的最佳实践

如何在保证模型性能条件下优化Prompt降低使用成本及响应延迟？

为什么说AI又要迎来自己的小低潮？

你应该知道的10个AI术语

OpenAI神秘項目「草莓」曝光！自我进化已超越人类智能？马斯克嘲讽：回形针灾难

伯克利：即使模型再强大，复合AI系统（ Compound AI Systems）都将会是一种领先的应用模式

对话聊天就是生成式AI最好的交互形态吗？不一定！

10位亿万富豪推荐的10本书

源码解读 - 微软GraphRAG框架

RAG与Long-Context LLM之争—没必要争

Outlines：让LLM结构化输出可控，提升LLM应用的稳定性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉