人类的一个标志是我们能够创造增强我们能力的工具,而智能机器人是迄今为止最复杂、最强大的此类工具。机器人可以增强人类的运动功能,学习完善和提升自己的自主技能,并通过协作提供超越人类和机器人固有能力的潜力。然而,并不能保证实现这种共享自治的优势。人类的自然适应和程序化的机器人适应可能无法有效地协同作用,导致协作任务的性能并不比任何一个代理单独执行任务时更好,甚至更差。此外,物理世界中次优的人机交互可能会产生严重的后果,例如人身伤害和设备损坏。因此,谨慎设计协作机器人算法对于防止与人类的无效和不安全交互所产生的负面后果至关重要。
人类和机器人之间的协作在很大程度上受到两个(或可能多个)代理之间交互的双向性质的影响,如图 1 所示的框图所示。人类和机器人反馈回路显示了每个代理的控制(决策)、具身本体和传感(感知)块。交互箭头将机器人、人类和任务块连接起来,象征着人类和机器人之间为实现共同任务目标而同时和双向地交换动作和实时响应。尽管实现最佳共享性能需要考虑两个反馈回路,但机器人回路比人工回路受到的关注要多得多。在这里,我们认为物理人机交互 (pHRI) 的下一个重大突破只有通过对人类成分的更仔细研究才能发生。
图 1.双向人机系统示意图。该示意图代表了人类和机器人的内部反馈回路之间的交互,并强调了执行常见任务所需的考虑因素。
与机器人的物理交互对人类行为的影响可以通过自然与强制框架进行正式研究。图 1 说明了这个概念,其中进入人工反馈循环的两个信号是任务结果(黄色信号)和机器人工厂模块的输出(橙色信号)。在没有机器人交互的情况下观察到的人类行为(紫色虚线信号)将代表人类系统对任务的自然反应。与机器人的额外交互(表示为图 1 中从机器人工厂到人类工厂前的总和的橙色实线)改变了人类行为。然后,观察到的行为是对任务的自然响应(黄色输入)和对机器人的强制响应(橙色输入)的总和。
根据具体任务,有效的机器人适应需要一个适当的自然或强制人类反馈回路响应模型。一些 pHRI 范式,例如人在环优化,仅对耦合人机系统的行为(强制响应)进行建模。或者,在机器人辅助康复等应用中,隔离人类的自然反应是必要的。在运动控制和学习研究中,通过在“捕捉试验”期间随机关闭机器人交互来测试人类的自然反应 。同样评估和监测人类对机器人交互的反应的方法,尤其是在长时间范围内,需要更多关注来量化 pHRI 的成功。
人机交互的成功取决于每个代理准确感知和感知交互和协作目标的能力 。这种感知的准确性与交互复杂性成反比,因为图 1 中的人类感知块在个体之间可能是不完美和不一致的。对人类感知进行建模的一个主要挑战在于,我们测量人类如何感知机器人和任务的能力有限。因此,人类使用来自各种传感模式(例如视觉、本体感觉、触觉和听觉模式)的信息来解释机器人伙伴的动作和意图的过程仍然难以捉摸。研究社会人机交互的心理学和神经学方法最近显示出解决这一差距的一些前景。
人类控制块监督高层决策及其由中枢神经系统响应环境输入而制定。这种动态反应受决策、适应和运动训练以及期望、信任和注意力水平等认知因素的影响,引入了可变性,这是人类运动培养适应性的一个关键方面。然而,这种可变性也使机器人难以预测人类行为。
尽管具有适应性,但研究人员经常将人类控制块描述为一个简化的时不变系统,而忽略了人类学习与机器人交互的潜力。此外,人们通常认为人类天生就是最佳的。尽管一些工作已经表明人类行为在特定环境中是最优的,并且人类运动控制系统被比作我们在机器人技术中使用的自适应控制定律,但所有行为的统一成本函数仍然难以捉摸。复杂性的许多来源——难以处理的影响变量数量、人类行为和学习的个体化性质,以及当人类几乎没有经验和信任时机器人代理引入的复杂性——使得很难找到一个通用的人类控制模型。未来的工作应该单独和全面地解决每个复杂领域。
人类神经运动系统非常复杂,在开发响应式机器人交互时不应低估。第一性原理方法提供了分析见解,但受到关于模型结构的过度简化假设的限制。相反,数据驱动的黑盒方法受到训练数据质量和数量的限制。本手稿旨在呼吁社区采取行动,利用这些方法的明智组合来对人机交互行为进行实证建模。
创建人类感知-认知-行动系统的模型对于使新的、成功的行为从人类和机器人之间的物理交互中协同出现至关重要。然而,在目前,构建整个人类神经运动系统的精确模型是不现实和不切实际的。几个世纪以来,神经科学家一直试图用数学方式描述人类的感知、控制和运动执行。尽管我们敦促 pHRI 研究界超越忽视或过度简化人类反馈循环,但我们也要求社区专注于开发能够巧妙平衡复杂性和能力的模型。目标是创建有用的模型,以充分描述人类反馈循环的方面,这些方面是实现共享人机交互承诺的瓶颈。