摘要
日常生活中,当我们在城市空间中穿行时,并非均匀地感知四周的界面,而是通过头部与眼球的转动,选择性地注视局部界面,忽视剩余的部分。如果不同个体间存在共性的视觉注意力机制,设计师可以基于该机制优化设计,实现有效的视觉引导,使建成空间更好地适应公众的认知习惯、达成相应的设计目的。然而,城市空间步行状态下的视觉注意力机制目前尚不明晰,行人可能注意哪些城市界面更是难以准确预测。为此,本文提出了一种结合360°视频和头戴式虚拟现实的步行模拟实验方法,解决了既有实验方法难以平衡可重复性和还原度的难题,并采集了138名受试者在102段步行空间中、45小时的眼动追踪数据。基于该数据,本文发现不同个体间的视觉注意力分布具有明显的共性,并揭示了形成该共性的一种可能机制:基于视觉信息局部熵的信息最大化策略。相较于当前主流的语义分割分析(AUC=57% ± 4%),该机制可以更准确地解释行人的视觉注意力分布(AUC=81% ± 3%)。此外,本文建立了首个大样本的城市空间全景视频眼动数据集,填补了专业数据的空白,并通过深度网络实现了基于场景影像的步行状态视觉注意分布预测,视域模型预测结果与实际视觉注意分布的线性相关系数(CC)达到0.59,优于经典的GBVS算法(CC=0.30)、非专业数据训练的模型(CC=0.44)以及设计师经验判断结果。这一机制及预测模型未来有望帮助建筑师更好地理解行人在不同设计方案中与建筑界面的视线互动过程,实现基于视觉认知底层规律的精准设计干预。相关数据集及预测模型可公开获取:
关键词:视觉注意力;行人;眼动追踪;局部熵;深度学习;城市人因工程学
选择性视觉注意力是建成空间认知的基础环节,通过眼动捕捉关键信息支撑了人在建成空间的行为决策,影响了人的空间体验,并帮助形成人对城市和建筑的记忆。准确的视觉注意分布预测可以帮助建筑师快速判断不同设计对人的视线引导效果,更精准地控制空间界面的设计和元素的布置,达成不同的设计目的,例如,设施的布局更符合人搜寻的直觉,地标性元素更易被公众自主感知等。既有研究已经借助眼动追踪,成功采集了人在不同城市空间中的注视点分布。当前研究以案例分析为主,尚未形成采集标准化、场景覆盖广的建成空间视觉注意力分布数据集;主要采用语义分割方法帮助提取了案例中不同空间元素的注视点分布占比,但这种占比是否具有跨场景的一般性尚未得到检验。基于上述背景,本研究聚焦城市环境中最常见的步行行为,尝试通过构建标准化的实验方法,建立大样本的城市空间视觉注意力分布数据,探索人在建成空间中更一般化的视觉注意力分布机制,并进行预测建模。
(1)确认了人群对同一步行场景的注视点分布具有高度的一致性
(2)验证了信息最大化是一种潜在的注视偏好策略,具有更高局部熵的位置更容易吸引人的注意力
(3)借助所建立的专业数据集,通过基本的卷积和循环网络构架实现了更准确的建成空间视觉注意力分布
该研究得到“十四五”国家重点研发计划,国家自然科学基金面上项目和唐仲英基金会的支持。
作者
Qixu Xie1,2, Li Zhang1,2*
本文通讯作者为清华大学建筑学院张利教授,第一作者为清华大学建筑学院博士后谢祺旭。作者团队所在清华大学建筑学院城市人因实验室致力于揭示人对城市和建筑的认知规律,实现建成空间认知过程的模拟和行为的预测,为设计决策过程提供实证成分的支持,增进设计干预的有效性和准确性。
Xie Q, Zhang L. (2024). Entropy-based guidance and predictive modelling of pedestrians’ visual attention in urban environment. Building Simulation, 17: 1659-1674.
https://doi.org/10.1007/s12273-024-1165-y
相关阅读:
长按二维码或点击左下角“阅读原文”访问全文
城市空间的视觉注意力:局部熵机制与预测建模
期刊介绍
Building Simulation 2008年创刊,是世界上第一本有关建筑模拟领域最新研究成果的英文学术期刊,跨多种学科领域,涉及建筑技术、土木工程、建筑学、环境工程、能源及动力工程等,致力于为中外同行提供一个高水平的学术交流平台。被SCI、EI Compendex、Scopus、CSCD等数据库收录。2024年SCI影响因子6.1,在JCR两个学科领域均位于Q1区;位于中科院期刊分区,工程技术类1区。