说说说，说你AI我！

科技 2024-11-19 08:30 广东

本文授权转自：淘宝设计（ID：ali-taobaoued）

引言

随着GPT-4o的横空出世，极大地拓展了人与机器之间的互动可能性。与AI对话，让AI服务于用户，成为一种新的交互范式。由此，淘宝融入语音技术与AI Agent能力，在搜索场景下拓展淘内场景化服务，把原语音搜的单一工具升级为语音助手，为用户提供更自然、更高效的购物交互体验。

▲全新版本淘宝语音搜即将上线

#01

从GUI到VUI

基于意图的新交互范式

自1984年Macintosh推出以来，GUI（Graphical User Interface，图形用户界面）一直主导着UX世界，用户与产品系统通过图形界面进行交互，每执行一个操作指令后，界面会返回任务状态或下一步任务，用户可以不断执行操作完成期望目标。在这种交互中，用户可借助图形元素（如按钮、图标、卡片、弹窗等）理解信息组织，并进行滑动、点击等操作向产品系统传递“命令”，是一种类似早期CLI （Command Line Internface，计算机命令行）的交互范式。它有着可视化、易交互、用户友好的优点，成为我们40年来内最主要的人机交互方式。

随着语音识别技术的迅猛发展和AI人工智能技术的普及，使得新的交互范式——VUI（Voice User Interface，语音用户界面）逐渐崭露头角。2011年, Siri作为iPhone 4S的一项新特性正式推出，标志着语音助手技术的开始广泛应用。当我们希望查询天气，不再需要找到天气App并点开它，而是可以直接说“嘿Siri，明天天气怎么样？”。

▲交互范式革新

这种新的交互范式，是一种基于“意图”的交互范式。它不再依赖于用户在界面上一步一步执行“命令”，仅仅需要用户“说”出想要达成的结果，系统通过NLP（Natural Language Processing，自然语言处理）、机器学习或模式识别并给出相应的意图承接方案。与传统的基于命令的交互相比，基于意图的VUI新增了语音交互，也仍然保留了GUI的元素，是一种声音混合图像的综合交互方式。

#02

意图获取

自然的多轮对话

VUI与GUI相比，最大的差异在于输入方式。其显著特性是“解放了双手”，在获取信息时可以用最自然的语言进行沟通。虽然人类天生擅长语言沟通，但在产品交互中描述要达成的结果，可能需要多轮对话交互。在与AI对话的过程中，产品需要先通过ASR（Automatic Speech Recognition，自动语音识别）获取用户意图，完成意图识别与处理后通过TTS（Text to Speech，文本转语音）回复用户，以此完成“听”与“说”的交互。

▲ASR与TTS

在GPT-4o的互动中，AI通过实时识别与处理、优先级管理与自然语言处理能力，可以让用户随时打断或改变话题，就像与人对话一样连续流畅。但目前大多数语言模型是基于序列生成的方式来回答问题，这意味着它们通常需要接收完整的输入才能产生输出。打断对话需要即时反应和状态切换，同时需要模型具备快速的理解和处理能力，这在当前的模型设计中尚未完全实现。

真实用户语音输入需求有随机、不确定及多样化的特点，让用户自然简单地与AI对话，ASR与TTS的状态切换至关重要。

声音无色无形，在VUI中需要一个用户输入及AI输出的媒介中枢，以及一套明确的交互机制应对复杂的用户场景，使声音交互符合用户自然对话的方式和习惯。

状态外化：媒介中枢为用户熟悉的产品化操作按钮。结合图像、色彩和文字提示，将AI唤醒、交互、识别、输出及静默的状态外化，给用户更明确的视觉反馈与操作引导，让单轮对话的体验更顺畅。
场景切换：根据对话场景确定初始状态。如唤起浮层时自动开启ASR获取用户需求，在Copilot形态下静默，不打断用户的SRP浏览心流。

▲语音交互状态外化

▲Copilot切换

#03

意图承接

灵活的产品形态

AI的介入带来的不仅是多轮对话的能力，而是在对话中不断明确用户意图，更好地进行需求承接。用户需求场景的不同，面向用户的产品形态也不同。在新版语音搜中，用户输入语音后，交互并没有结束，通过不同形态的产品框架发挥多轮交互优势。

基础形态：轻浮层拉起即唤醒，聚焦于语音交互。
mini形态：以Copilot的形式从旁协助用户，在未有指令前静默，不打扰用户主流程体验。
拓展形态：兼容widget组件，承接操作或结果型需求，任务完成后继续语音更顺畅。

▲产品形态变化

同时，在VUI中语音和图形界面应该是相互补充，但不重复的。在多样的需求场景中，为保证淘内复杂业务场景下交互的流畅性与可拓展性，我们确定了语音与图形界面交互的基本原则。

灵活自主：支持声音、视觉双通道交互。用户自由选择交互方式，支持更灵活的使用场景。在AI输出过程中，用户可以通过图形界面给出反馈，减少声音输出于视觉输入的滞后性。
各有主次：二者各司其职，各有主次。语音负责意图收敛、操作引导等反馈，图形界面负责展示详细信息及提供视觉确认。
简单直接：将用户任务拆解，非核心操作由AI代理，减低用户操作成本；关键操作由用户决策，避免意图理解错误导致的负向体验。

基于以上体验原则，淘内各个业务可根据自身使用场景，将原GUI链路转化为的VUI链路，为用户提供更自然友好的服务体验。

搜索更精准

对于用户找商品的意图，通过query改写和Copilot的意图收敛，优化商品召回相关性，让搜索更精准。

▲搜索更精准

寻址更快捷

对于用户寻址类意图，提供声到令下的直达式服务。同时对于模糊意图的输入，也能顺畅承接。

▲寻址更快捷

服务更轻松

对于用户服务类意图，AI代理部分链路操作，体验更轻松。

▲服务更轻松

目前，话费充值、价保、寻址等服务已接入，更多淘内服务场景持续拓展中。此外，陪伴闲聊需求也能给予用户情感化响应和支持。

#04

双重感官

丰富的声音人格化

为了更加还原人类的自然对话，我们对声音进行了人格化设计。人格化不仅包含音色音调、语速节奏、说话方式及其他声音元素特征，还包含年龄、MBTI、风格、兴趣爱好等多元特征，以便在与用户互动时能够传达出一致的性格形象和情感体验。

▲声音细节设计

声音人格化的设计不仅使得人与AI的交互更具吸引力，还能在一定程度上提升用户的使用体验。

▲声音人格化设计

通过将不同的声音特质与具体的人物形象相结合，不仅赋予了用户与AI互动时的情感温度，也让AI能够在不同的情境中展现出更高的适应性和灵活性。

▲小淘声音的人格化设定

▲小淘声音的情绪设定

通过人格化的设计，将虚幻的AI助手拓展成生动丰富的“伙伴”，可以满足不同用户的期望和需求，提供更个性化的服务体验。

▲小天声音的人格化设定

▲小天声音的情绪设定

结语

从最初的GUI到如今的VUI，人与AI的互动方式正在革新。通过多轮交互的和精准的意图承接能力，AI不再仅仅是工具，而是用户生活中不可或缺的智能伙伴。相信在不久的明天，随着AI能力的提升和用户平台数据的整合，传统的人找品的匹配模式将被彻底革新，在货架电商和内容化推品之外衍生出全新的商品&内容&服务组合模式，VUI将进一步演变为多模态意图输入的综合交互形式，为用户提供更精彩的购物体验。

-END-

文章转载：淘宝设计，版权归原作者所有

原文链接：https://mp.weixin.qq.com/s/fnSMOdue0av0cSzUoZIt8A

版权声明：“IXDC”所推送的文章，除非确实无法确认，我们都会注明作者和来源，本公众号对转载、分享的内容、陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完善性提供任何明或暗示的保证，仅供读者参考。部分文章推送时未能与原作者取得联系，若涉及内容或作品等版权问题，烦请原作者联系我们，给出内容所在的网址并提供相关证明资料，我们会核查后立即更正或者删除有关内容！本公众号不承担任何责任，并拥有对此声明的最终解释权。

联系微信：18802086168

联系电话：18802086168

编排 | 巫欢

终审 | 苏菁

▼


点这里，学习更多设计知识！
👇

http://mp.weixin.qq.com/s?__biz=MjM5MTg2NDA3MQ==&mid=2652216099&idx=1&sn=918846438ab3e98897c0d833572f2cbf

IXDC

IXDC是全球领先的用户体验创新盛会，致力于探索和分享设计界最前沿的思想和技术，是中国连接世界的跨界创新平台。自2009年起，IXDC发挥“设计外交”作用，搭建跨越国家、文化和语言界限的桥梁，帮助各行业人士获得应对21世纪挑战时的全球视角。

最新文章

作品集里放体验地图，八成是白费功夫

IXDC专访 | 黄婷：AI时代下的设计思维与变革

显示器还能这样设计?

感恩节 | 心怀感恩，所遇皆温柔

在国际科技巨头苏州园区办公，是怎样的体验？

IXDC专访 | 赵东恩：AI时代设计领域的变革与设计师的职业发展

蛇年蛇墩墩来啦！由冰墩墩原班人马打造。网友：换个衣服继续卖？

网易云音乐再发声！坚持创新和尊重原创

美啊直播 | 2024站酷设计周“当设计遇见科技”

这套儿童友好城市LOGO，儿童会喜欢吗？

物理学得好：摄影高级艺术信手拈来！

蔚来发布十周年纪念LOGO，这很蔚来（附品牌手册下载）

IXDC专访 | 张杨：AI与机器学习在金融产品设计中的应用

产品设计师？这么多设计岗位到底什么意思？

一点点改变，就让图标差异感拉满！

IXDC专访 | 刘妍：探索AI 时代下微软产品设计中的创新与平衡

全球首个世界绿色设计之都启动创建！

这样规划作品集，让你的效率提高2倍！

铃铃铃，这些闹钟UI看起来怎么都差不多？

从容器体验到对话设计，看看百度是如何让法律咨询变的超简单！

IXDC专访 | 黄蓉：AI在零售体验设计中的应用与未来展望

最新可口可乐圣诞广告改用AI，网友：少了点人味！

很艳，很惊艳，两大妙招盘活品牌

IXDC专访 | 任婕：AIGC技术下的新模式与职业晋升

在苹果做设计师，我学到的 10 个重要经验

日本做的网页设计确实厉害，我的设计有点献丑了！

小雪 | 苍山见雾，雪落人间

B端设计进阶！常见误区有哪些？

中厂怎么做AI，聊聊实用主义的美图

原研哉、隈研吾又出新作了！

2024金点奖概念设计获奖作品赏析！

英文LOGO设计好，省力又讨好！

从繁到简：B端如何提升用户体验

IXDC专访 | 孙瑾：AI工具在用户研究与设计流程中的提效与应用

说说说，说你AI我！

IXDC专访 | 辛欣：设计体系在产品开发中的核心作用与AI设计工具的展望

想让面试官心动？来看看这份B端UI作品集设计

中文海报，也可以很好看！

IXDC专访 | 李田原：小米汽车 SU7 背后的设计美学与用户体验设计，引领未来出行新风尚

这次真学到了：6个App亮点案例来袭！

短短3个月，国产AI视频进入4K时代？

贾樟柯《风流一代》新海报，由黄海设计！

VI | 小米品牌手册（附下载）

IXDC专访 | 冯婷：科技浪潮下，荣耀如何打造个性化美学体验

Emoji的隐藏玩法大揭秘

巴黎世家推出“天价垃圾袋”，时尚界的新宠儿！

IXDC专访 | 方贞硕：数字化技术引领小米汽车座舱HMI新纪元

评论区设计的三个维度、九个考量点

“动动嘴”就能编辑图像，豆包悄咪咪上线了这个超实用的新功能

这中文排版细节，闭眼抄！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉