【Building Simulation 封面文章】城市空间的视觉注意力:局部熵机制与预测建模

文摘   2024-11-23 18:00   湖南  


摘要

日常生活中,当我们在城市空间中穿行时,并非均匀地感知四周的界面,而是通过头部与眼球的转动,选择性地注视局部界面,忽视剩余的部分。如果不同个体间存在共性的视觉注意力机制,设计师可以基于该机制优化设计,实现有效的视觉引导,使建成空间更好地适应公众的认知习惯、达成相应的设计目的。然而,城市空间步行状态下的视觉注意力机制目前尚不明晰,行人可能注意哪些城市界面更是难以准确预测。为此,本文提出了一种结合360°视频和头戴式虚拟现实的步行模拟实验方法,解决了既有实验方法难以平衡可重复性和还原度的难题,并采集了138名受试者在102段步行空间中、45小时的眼动追踪数据。基于该数据,本文发现不同个体间的视觉注意力分布具有明显的共性,并揭示了形成该共性的一种可能机制:基于视觉信息局部熵的信息最大化策略。相较于当前主流的语义分割分析(AUC=57% ± 4%),该机制可以更准确地解释行人的视觉注意力分布(AUC=81% ± 3%)。此外,本文建立了首个大样本的城市空间全景视频眼动数据集,填补了专业数据的空白,并通过深度网络实现了基于场景影像的步行状态视觉注意分布预测,视域模型预测结果与实际视觉注意分布的线性相关系数(CC)达到0.59,优于经典的GBVS算法(CC=0.30)、非专业数据训练的模型(CC=0.44)以及设计师经验判断结果。这一机制及预测模型未来有望帮助建筑师更好地理解行人在不同设计方案中与建筑界面的视线互动过程,实现基于视觉认知底层规律的精准设计干预。相关数据集及预测模型可公开获取:

https://github.com/LiamXie/UrbanVisualAttention


关键词:视觉注意力;行人;眼动追踪;局部熵;深度学习;城市人因工程学

01

背景介绍

选择性视觉注意力是建成空间认知的基础环节,通过眼动捕捉关键信息支撑了人在建成空间的行为决策,影响了人的空间体验,并帮助形成人对城市和建筑的记忆。准确的视觉注意分布预测可以帮助建筑师快速判断不同设计对人的视线引导效果,更精准地控制空间界面的设计和元素的布置,达成不同的设计目的,例如,设施的布局更符合人搜寻的直觉,地标性元素更易被公众自主感知等。既有研究已经借助眼动追踪,成功采集了人在不同城市空间中的注视点分布。当前研究以案例分析为主,尚未形成采集标准化、场景覆盖广的建成空间视觉注意力分布数据集;主要采用语义分割方法帮助提取了案例中不同空间元素的注视点分布占比,但这种占比是否具有跨场景的一般性尚未得到检验。基于上述背景,本研究聚焦城市环境中最常见的步行行为,尝试通过构建标准化的实验方法,建立大样本的城市空间视觉注意力分布数据,探索人在建成空间中更一般化的视觉注意力分布机制,并进行预测建模。

02

核心内容

(1确认了人群对同一步行场景的注视点分布具有高度的一致性

相同场景同一时刻的被试间相互预测的准确性(AUC)达到94% ± 3%,高于随机基准(50%)和基于朝向分布偏倚(center bias)的随机采样(83% ± 1%)。该结果表明除了基本的朝向共性,不同人之间可能还存在某种针对空间界面的共性注视偏好。

图1




(2)验证了信息最大化是一种潜在的注视偏好策略,具有更高局部熵的位置更容易吸引人的注意力

实验采集的总计444万个注视点中,超过64%分布于所在视频帧局部熵前20%的区域。以空间界面局部熵大小作为唯一变量,对注视位置的预测准确率达到(81% ± 3%)。而传统的语义分割得到的注视点占比排序在全部102个场景中对注视点预测的准确率(AUC=57%± 4%)仅小幅高于随机基准。局部熵的高低同时能够解释各种空间元素在不同场景间被注视概率的差异。

图2




(3)借助所建立的专业数据集,通过基本的卷积和循环网络构架实现了更准确的建成空间视觉注意力分布

模型在局部视域和全景视域上的预测结果与实际视觉注意力的线性相关系数分别达到0.59和0.67,超过了传统显著性模型(GBVS)和非专业数据训练的深度模型。此外,通过采集职业建筑师的经验判断结果,本研究也初步验证了该预测模型可以在设计决策过程中,提升建筑师对视线引导效果的判断准确度。

图3




03

资助信息

该研究得到“十四五”国家重点研发计划,国家自然科学基金面上项目和唐仲英基金会的支持。


作者  

Qixu Xie1,2, Li Zhang1,2*

Department of Architecture, School of Architecture, Tsinghua University, Beijing 100084, China

2 Urban Ergonomics Lab, School of Architecture, Tsinghua University, Beijing 100084, China


作者团队简介

本文通讯作者为清华大学建筑学院张利教授,第一作者为清华大学建筑学院博士后谢祺旭。作者团队所在清华大学建筑学院城市人因实验室致力于揭示人对城市和建筑的认知规律,实现建成空间认知过程的模拟和行为的预测,为设计决策过程提供实证成分的支持,增进设计干预的有效性和准确性。


引用

Xie Q, Zhang L. (2024). Entropy-based guidance and predictive modelling of pedestrians’ visual attention in urban environment. Building Simulation, 17: 1659-1674.

https://doi.org/10.1007/s12273-024-1165-y


相关阅读:


长按二维码或点击左下角“阅读原文”访问全文



长按访问原文

城市空间的视觉注意力:局部熵机制与预测建模





Building Simulation 2008SCIEI CompendexScopusCSCD2024SCI子6.1JCRQ11


公众号:建筑模拟
期刊官网1 (国内免费下载)
http://www.sciopen.com/journal/1996-3599
期刊官网2 (海外合作)
http://www.springer.com/journal/12273
编辑部:bsjournal@tsinghua.edu.cn
本期微信制作:张启林

建筑模拟
Building Simulation is a peer-reviewed international journal published by Tsinghua University Press and Springer Nature.
 最新文章