对话聊天就是生成式AI最好的交互形态吗?不一定!

文摘   2024-07-11 10:48   北京  
当下,以ChatGPT为代表的大模型AI应用都采用对话式的交互形态。各种各样的应用都被改造成自然对话的方式,LUI以及对话式的交互形态俨然已经成了是不是一个AI应用的标志

那么,LUI就一定是最佳的形态吗?不一定,不可否认聊天的方式与大模型交互非常的自然,门槛也足够低,这对于一些目标清晰,步骤简单的任务非常有效。但是,遇到了一些复杂的,难以通过简单语言表达的复杂任务就很困难,想象一下,通过对话,让大模型生成一个业务流程Pipeline,这时候局限性就非常明显,用户拖拉拽就能搞定的事情,要通过对话来表达就相当考验人的表达能力和AI的理解能力。LUI的表现形式就一定是聊天方式(chat-based)最优吗?显然也不是。,比如想要 Midjourney,生成一副图片,也需要很高的提示技巧,而且这一过程是一个反复盲盒抽卡的对话过程,这一方面是受到了对模型控制能力的约束,另一方面就是我们现在讨论的主题。这样的局限性,任务也复杂,表现的也越明显。
有没有更好的交互方式突破这样的限制呢?国外有设计师Matthias Dittrich结合自己平日的工作体验和协作方式,提出了“人与AI协作”的交互方式[1]。如果把对话式看作是两个人“one-one”沟通解决问题,那么,这种协作模式就是两个人坐在一起,提供纸笔一起协作工作,一起探索方案,一起完善细节,大家能够在一个画布上进行编辑,互相都能看到它带来的影响。在无需大量语言沟通的情况下,就能够准确理解每一个过程和细节,最终共同完成一个复杂的任务。也许这时候你想到了“结对编程”,对,笔者觉得协作模式大体就是这样的。而“人与AI协作”便是将和你结对的人换成了AI,围绕这样的思想展开,就形成了这一交互模式的思想内核。下面是他对这一模式的更具体解释:

1. 提供持久的画布(工作区),共享持久的画布是”协作模式“关键特征。这个画布是一个可以更新的工作区,不需要在每次prompt时都重新渲染。用户应该能够了解所更改的内容,以评估更新是否符合预期。微软Copilot已经在使用类似的模式 。AI就像真人助手一样坐在你身边,而画布(你的 Word 或 Excel 文档)则位于前方和中心位置。

2. 让用户对多个选项进行比较 。通常从广义上开始创作过程,大多数人喜欢探索不同的方向--不仅是在设计屏幕时,在设计文字大纲或图表时也是如此。在探索过程中,需要比较不同的方向,考虑它们的优缺点。如果能在工具中直接进行比较,那有很大帮助。Midjourney 已经为每个请求提供了多个选项。不过,这些选项目前都是临时性的,或多或少会随着以下提示而被遗忘。

3. 提供手动添加或编辑的选项。 通常情况下,自己进行一些更改比提示AI工具进行更新更容易。直接操作输出的能力能让用户更快、更精确地进行操作。Grammarly 就是一个很好的例子。虽然它也可以从头开始生成文案,但他主要用它来改进他已经写好的文本。在它更新后,可以继续编辑,这往往会导致多轮的来回修改。

4. 让用户能够完善细节 特别是当你有一些特定的想法时,生成式AI就会变得很棘手。总有一些小细节与你的想法不同。重新渲染可能会解决当前的问题,但也可能产生新的问题。您可以事后在其他应用程序中调整这些问题,但您可能还想继续使用AI工具,这使得工作流程变得繁琐。特别是结合添加或编辑的功能,这将使许多 AI 工具变得更加精简和高效。Photoshops 的 AI 照片编辑器可以为选定区域生成新图像。它有助于处理构图的特定部分,从而逐层创建您想要的图像。

与其他新技术一样,设计师们已经做好了塑造这些工具的准备。 对话类AI在处理一些复杂任务场景时,不必刻板模仿,可以考虑改变思维模式,从一对一聊天转变为协作画布。这可以消除许多障碍,让用户更精确、更高效。总的来讲,以人为本,结合真实场景体验,才能更好的发挥AI的价值。

参考:

[1]https://uxplanet.org/stop-designing-chat-based-ai-tools-f68aba9119b4

后台回复“进群”入群讨论。

 
橱窗有更多精选好书,欢迎光顾。

AI工程化
专注于AI领域(大模型、MLOPS/LLMOPS 、AI应用开发、AI infra)前沿产品技术信息和实践经验分享。
 最新文章