【会议回顾】课题组多项研究成果在ACM SIGSPATIAL 2023发表

文摘   其他   2023-12-20 10:17   北京  


会议回顾

 SIGSPATIAL 2023 


今年11月13日至16日,第31届国际计算机学会主办的国际地理信息系统大会(31st ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems)在德国汉堡召开。在本次会议上,课题组共有9篇大会论文及1篇Workshop论文进行展示。论文的第一作者分别为博士后刘志成、秦荧瑢,博士生刘宇、韩振宇、周之伦,硕士生王牡丹、李府显、巩佳辉、唐寅州。




PART/1

 会议介绍

ACM国际地理信息系统大会(SIGSPATIAL)是地理信息系统(GIS)领域的顶级国际学术会议。该会议创立于1993年,致力于推动和促进GIS领域的研究和发展。其宗旨在于为学术、产业和政府机构的专业人士提供一个交流的平台,共同探讨空间数据和地理信息系统领域的最新研究成果、技术创新和未来发展趋势。空间信息是一个涉及地理位置、地理空间和地理现象的综合领域,涵盖地图学、遥感、地理信息系统等多个学科。SIGSPATIAL会议涵盖的主题包括但不限于地理数据库、空间数据挖掘、地理信息检索、地理信息可视化、位置感知应用、地理信息系统设计与评估等多个方面。SIGSPATIAL 2023吸引了相关领域研究者的广泛参与,并得到了苹果、Esri、甲骨文等著名公司和机构的赞助。


PART/2

 论文解读



01


大会论文《该看哪个灯?在高精地图中自动关联交通灯与道路》"Which Traffic Light Should You Look at? Automatically Associating Traffic Lights with Roads in High-Definition Map" 第一作者:刘志成(博士后)


高精地图在智能驾驶中发挥着重要作用,但生产高精地图需要大量人工进行标注,导致生产成本高昂,极大限制了高精地图的规模化应用。为了提升产能产效并降低生产成本,学者及业界专家已开展了大量高精地图自动化生产的相关研究,但现有研究主要集中于从图片或点云中进行目标检测并提取相应目标的几何信息,而忽略了交通规则理解的问题。高精地图不仅包含精准的车道几何信息,还富含各类交通规则信息,以帮助智能驾驶汽车按照交规行驶。基于此,本文聚焦于交通规则理解,并以推断交通灯所控制道路为具体研究问题。该问题的难点主要体现于两方面:1)推断交通灯所控制道路极度依赖于对道路环境上下文的理解,而不能以孤立的灯-路相对位置、朝向关系进行推断。尤其面对我国复杂多样的路口状况,需要综合理解路口中多个灯、多条道路的相对位置、朝向关系、类型组合才能进行合理推断。2)需要对地图矢量进行建模表征。高精地图中所有地图要素均由地图矢量进行表达和存储,而地图矢量本质上是任意长的空间点序列,是一种非结构化空间数据。为了解决以上难点,本文提出一种基于Transformer的异构交互地图矢量表征学习模型(HIST),该模型可以直接对地图矢量进行空间编码,并通过道路-道路、道路-设施、设施-设施之间的交互编码道路环境上下文信息。经过实验验证,该模型能够适用于大量复杂、不规则的路口场景,并具备良好的泛化能力,可泛化至重庆、北京等不同道路风格的城市。该模型已被部署于高德地图的高精地图产线,极大提升了生产效率。





02


大会论文《地点访问的用户细粒度兴趣建模》"Modeling Multi-Grained User Preference in Location Visitation" 第一作者:秦荧瑢(博士后)


在过去的十年里,学者和工业界专家广泛关注用户出行预测问题,通常通过用户历史出行记录和先验知识(如地理位置、功能类目、品牌等)来预测未来可能去的地点。用户的出行活动与地理多尺度特点紧密相关,例如明确的出行需求如工作日午餐会考虑单一地点的功能,而复合出行需求如旅行度假则优先考虑区域尺度的特点,选择集休闲娱乐、住宿、餐饮多功能于一体的区域。然而,已有工作往往忽略了用户的出行偏好与多尺度的地理特点之间的关系,这使得用户的出行偏好无法被准确建模。此外,不同地理尺度之间的关联性也加剧了在不同地理尺度上解耦用户出行需求的困难性。针对上述问题,本文提出了一个知识增强的图模型MMGUP。具体而言,我们首先提出了一个基于先验知识的构图模块,将地理先验知识(地点的地理位置、地点和区域之间的从属关系)和功能先验知识(地点的功能类目信息、品牌信息等)、用户地点交互信息等转化成图上的连边关系。进一步地,我们提出了一个知识增强的信息提取模块,该模块采用关系感知的消息传播策略区分不同节点的差异性,并采用区域-地点两层地理校准方法增强节点之间的地理相关性。最后,我们提出了一个预测模块,通过解耦不同地理尺度上用户偏好、进而预测用户未来的访问行为。在两个数据集上的实验表明,我们提出的MMGUP方法在大多数场景下的性能远优于基准方法,后续的消融实验也证明了MMGUP方法的核心设计有效。





03


大会论文《基于城市知识图谱的选址规划》"KnowSite: Leveraging Urban Knowledge Graph for Site Selection"第一作者:刘宇(博士生,现牛津大学博士后)。


选址规划是城市商业和规划领域长期关注的重要问题,决定了新的商店或设施最佳布局位置,对于业务的成功和城市的发展至关重要。近些年,随着城市海量多源数据的长期积累和人工智能技术的广泛应用,智能化选址规划为该问题提供了新的解决思路。然而,现有的数据驱动方法过于依赖特征工程,无法全面考虑数据之间的复杂关系和不同语义信息的多样化影响。此外,大多数方法缺少对选址决策的解释分析,难以进行实际应用。为了摆脱这一困境,我们在这项研究中,通过运用知识图谱技术,提出了一个知识驱动的选址规划模型,KnowSite。具体而言,我们首先从海量多源城市数据中构建了一个城市知识图谱,以捕捉城市的关键要素和复杂关系,用于进行选址规划知识的发现。进一步,基于城市知识图谱我们设计了一个通用的编码器-解码器框架,进行选址决策。具体而言,KnowSite采用了基于图神经网络的编码器,以自适应地建模多样化影响,并进一步构建了一个基于关系路径的解码器,揭示了选址决策背后的原因。在两个数据集上进行的实验表明,KnowSite性能超过基线方案9%,并通过注意力机制为选址决策提供了直观可信的解释,为智能化选址规划提供了新的视角。

韩振宇代讲





04


大会论文《街景卫星图像识别建成环境疾病传播风险》"Devil in the Landscapes: Inferring Epidemic Exposure Risks from Geo-Tagged Imagery"第一作者:韩振宇(博士生)


城市建成环境是人类为保证正常城市功能的运行所构建的一系列物理要素,涵盖建筑设施、道路桥梁、公园绿地等各类城市基础设施,是人类健康的环境决定性因素。本研究提出利用街景卫星图像预测疾病传播风险的全新框架,基于人口流动仿真构建城市疾病传播网络,并融合传染病数学模型与图神经网络,将传统领域知识嵌入到深度学习模型的设计中,实现了知识-数据协同驱动的研究范式。此外,模型还通过构建辅助任务显式预测街景图像中影响疾病传播的相关特征占比,通过多目标学习的方法进一步引入领域知识,提升预测性能。该研究建立了从传播风险定义到预测的完整框架,藉由公开可得的海量街景数据为缺乏大规模传染病检测能力的地区提供了新的疫情风险评估手段。




05


大会论文《基于知识增强扩散模型的城市人流量生成》"Towards Generative Modeling of Urban Flow through Knowledge-enhanced Denoising Diffusion"第一作者:周之伦(博士生)


城市人流量对于公共安全、交通管理和城市规划等广泛领域有重要意义。现有研究主要关注人流量的预测式建模,即根据历史人流量数据预测未来人流量。然而,这些方法依赖历史人流量,因此不适用于数据稀缺的区域。在这项工作中,我们研究一个新的人流量生成问题,根据区域特征,为没有历史人流量数据的区域生成动态的人流量数据。为了捕捉影响城市人流量的多种因素,如区域特征和城市环境,我们将问题建模为条件生成问题,并采用扩散模型来更好地控制生成过程。我们首先构建城市知识图谱(Urban Knowledge Graph,UKG)来建模城市环境和区域之间的关系,然后设计了一个知识增强的时空扩散模型(KSTDiff)来为每个区域生成人流量。具体来说,为了解决区域之间流量规模差异大的挑战,我们设计了区域特异的前向扩散过程,通过一个流量规模估计模块预测区域的流量规模,并据此对不同的区域添加不同的噪声,以区分不同流量规模的区域。在生成过程中,我们设计了知识增强的去噪网络以捕捉人流量的时空相关性以及城市环境的影响,以达到更好的生成效果。在四个真实数据集的实验验证了KSTDiff能比现有方法生成更加真实的人流量数据。进一步的研究说明,KSTDiff也能长期的人流量生成和人流量预测任务。同时,生成的城市人流量数据能有效用于OD流量生成的下游任务。




06


大会论文《传播过程启发的跨尺度时空图神经网络交通拥堵预测》"Contagion Process Guided Cross-scale Spatio-Temporal Graph Neural Network for Traffic Congestion Prediction"第一作者:王牡丹(硕士生)


频繁的交通拥堵对出行体验和城市生活的整体质量产生不利影响,而准确预测交通拥堵对于缓解拥堵问题具有关键作用。但现有的交通预测方法主要侧重于提取局部变化模式,忽视了纳入全局动态模式的重要性。这提出了三个挑战:1)局部(微观)交通模式中存在复杂的时空信息;2)全球(宏观)交通拥堵的传播和消散模式表现出跨时间和空间的复杂动态;3)对宏观和微观拥堵变化模式之间的相互作用进行建模仍然未知。在本文中,我们提出了一种集成微观和宏观跨尺度时空建模的交通拥堵预测新框架。我们的方法利用传染动力学来表征网络范围内的拥塞传播和恢复。此外,我们采用时空图神经网络来捕获本地流量模式。一个关键贡献是引入了可微的微观-宏观转换机制,使得在模型训练期间能够以可微的方式将微观状态聚合为宏观状态。此外,我们利用从宏观传染动力学中获得的知识,通过采用物理信息神经网络来约束微观交通模式。对三个现实世界交通拥堵数据集的实验表明,我们的预测模型始终优于最先进的基线。

韩振宇代讲




07


大会论文《为移动交通预测赋能空间知识图谱》“Empowering Spatial Knowledge Graph for Mobile Traffic Prediction”。第一作者:巩佳辉(硕士生)


准确预测基站流量可以实现资源高效配置并确保高质量通信服务,这对于智慧城市发展至关重要。其中,周围环境信息在移动交通预测中起着至关重要的作用,然而,现有的方法并没有很好捕捉基站之间的关系与环境信息。在本文中,我们利用空间知识图谱来表示空间信息并添加城市重要实体来增强,使其成为捕获环境信息的有效的工具。我们进一步提出多关系知识图卷积网络模型,由三个部分组成。环境信息建模部分使用 tucker 从空间知识图谱中捕获空间信息,并使用关系图卷积网络建模提取基站之间复杂关系,基站语义信息建模部分使用transformer和因果卷积来捕获时间特征。注意力间融合建模基站之间时空特征并预测未来的交通量。广泛的实验表明,我们提出的模型性能超过基线方案10%以上。




08


大会论文《基于周期性变化和事件感知时空图卷积网络的交通拥堵预测》"Periodic Shift and Event-aware Spatio-Temporal Graph Convolutional Network for Traffic Congestion Prediction"第一作者:李府显(硕士生)


快速城市化导致人口密度和车辆数量增长,随之而来的交通拥堵恶化了用户出行体验,影响城市经济发展。准确预测交通拥堵趋势,在缓解交通拥堵、便利用户出行等方面发挥了重要作用。例如,人们可以根据谷歌地图或高德地图提供的交通拥堵信息提前计划出行,避开拥堵路线。这启发我们设计有效且智能的方法,以在短时间内准确预测交通拥堵。然而,由于交通数据中存在复杂的时空相关性,实现对交通拥堵的准确预测并非易事。近期研究主要集中于预测交通流量或交通流速度。这些工作预测的是交通流的实际值,但人们更希望知道未来一段时间的交通拥堵程度。此外,虽然这些工作考虑了交通数据中的空间或时间依赖关系,但仍然有挑战(复杂的长周期性、中短期时间依赖关系、时空相关性)没有得到很好解决。本文提出了一种新颖的神经网络框架用于交通拥堵预测。首先,本文对长期序列周期性进行建模,其次,为了有效捕捉短期和中期的时间依赖关系,本文采用LSTM来捕捉交通拥堵事件的序列依赖关系,并进一步集成了图卷积网络。本文贡献总结如下:第一,重点建模了交通数据中的长期多尺度周期性,并设计了有效的时空提取架构。第二,对拥堵事件进行编码,并提取拥堵事件序列中的序列依赖关系,以建模拥堵事件发生和变化的规律,进一步提升模型预测性能。第三,基于真实世界的大规模交通数据集对模型进行评估,实验结果证明了模型的有效性。




09


大会论文《融合多尺度人类移动动力学增强的传染病空间传播预测》"Enhancing Spatial Spread Prediction of Infectious Diseases through Integrating Multi-scale Human Mobility Dynamics"第一作者:唐寅洲(硕士生)


近年来,像COVID-19这样的流行病对全球公共卫生、经济和日常生活构成了重大威胁。准确地进行流行病学测量、建模和监测对于向公共卫生专家、政府管理人员、决策者、应急人员和普通公众提供信息至关重要。利用先进的定位和移动通信技术收集的移动轨迹数据,现有的研究者们已经提出了许多基于人类移动动力学的方法来预测传染病的空间传播。但是这些模型还存在着个体层面的用户感染信息状态相关联的细粒度用户移动轨迹由于隐私问题难以获取、忽略个体层面变化、过度简化现实、使用不完整或不精确的数据的缺点。因此,本文提出了一种用于预测传染病空间传播的多尺度空间传染病预测网络MSDNet。该模型结合人口流动图中宏观信息和用户接触图中微观信息的时空特征,采用宏微观协同的方式预测传染病的传播。为了理解人类流动与传染病传播之间的耦合,本文提出了一种将传染病传播动力学和传染病参数建模相结合的损失项,即使在人类流动受到旅行限制等政策措施影响时,也可以实现对传染病关键特征的稳定适应。广泛的实验结果表明,MSDNet模型在使用宏微协作的图网络上进行流行病预测的优越性。此外,我们还对人类移动性变化下的传染病参数进行了预测,结果表明MSDNet能够有效区分人类移动性和传染病特征。




10


Workshop论文《城市级高性能时空移动模拟系统》"A City-level High-performance Spatio-temporal Mobility Simulation System "第一作者:张钧(博士生)


城市移动模拟是指对人类在城市中的细粒度时空交通和活动行为的模拟仿真,这有助于衡量交通运行状况、评估交通对城市其他领域(如环境)的影响、支持制定模拟驱动的与交通相关的可持续政策,是支撑可持续城市发展的重要工具之一。然而,目前制约交通仿真及其应用的主要挑战是在处理城市规模的百万甚至千万人口仿真时性能不佳。在移动模拟中,人和车辆等智能体需要根据附近其他智能体的上一步状态采取行动,这反映了智能体之间的时空依赖性,这是实现高效并行计算加速的主要障碍。为了缓解时空依赖性对并行加速的影响,我们提出了一种城市级高性能时空移动模拟系统,该系统设计了基于读写分离的两阶段并行流程和索引子系统。两阶段并行流程通过将所有状态重组为公共只读、公共只写和私有三类,并引入合理的两阶段控制流设计,优化了智能体之间的状态读/写流程。索引子系统通过并行友好的数据结构选择、添加、删除和查询流程设计,优化了空间归属关系维护和相对位置查询。我们分别在 CPU 和 GPU 上实现了整个系统,广泛的实验证明该系统在性能方面达到了预期效果,并能支持有关可持续移动性研究的创新应用。实验表明,在同时有近 100 万人参与的城市级模拟中,我们提出的系统的计算速度是挂钟时间的 278.77 倍,即每步 3.59 毫秒。




会场照片 可左右滑动


PART/3

 参会分享

会议结束返校后,参会同学分享了会议期间的见闻与经验。


韩振宇介绍了本次会议的两个Keynote,《Ocean and Climate, and the Need for Marine Data Science》与《Sensable Cities》,分别是亥姆霍兹海洋研究中心的Arne Biastoch教授与MIT Sensable City Lab的Carlo Ratti教授的报告。Arne教授介绍了海洋科学与计算机科学的交叉探索,从海洋科学研究中面临的实际挑战出发,抽象为计算机科学中的算法问题,从而开展交叉学科合作研究。Carlo教授则从未来城市设计出发,通过移动数据、邮件通信数据、LiDAR数据、智能手机数据、图像数据等对城市进行智能化监测与感知,发挥数据价值推动城市可持续发展。

图片可左右滑动


周之伦介绍了本次会议的基本情况以及实验室研究方向相关性较强的Paper、Poster和Demo。《DiffSTG: Probabilistic Spatio-Temporal Graph Forecasting with Denoising Diffusion Models》将扩散模型应用于时空图预测任务;《TrajGDM: A New Trajectory Foundation Model for Simulating Human Mobility》使用扩散模型进行轨迹生成;《Heterogeneous Attention Network Model for Longitudinal Analysis of Socioeconomic and Racial Inequalities in Urban Regions: Evidence from Chicago, IL》在城市区域表示学习的基础上加入时间维度,发现表征变化大的区域也存在较大的种族成分变化。


此外,大模型也是本次会议的一个热点。一方面,有些研究探讨大语言模型在GIS领域的能力和应用,比如《Are Large Language Models Geospatially Knowledgeable》发现LLM编码了一定的地理空间知识,能正确理解地理的方位;微软的《Map GPT Playground: Smart Locations and Routes with GPT》结合LLM和地图工具,能根据用户的自然语言指令生成更准确的路线规划。另一方面,会上也有关于地理空间大模型的讨论。和LLM相比,地理空间大模型的难点在于预训练任务如何与下游任务对齐,以及缺乏真实标签,对此有人认为可以将地理空间数据和文本对齐,或是借助LLM的能力来处理地理空间数据。不过总体来说,关于大模型+GIS的研究还是较少,也比较初步,这是一个值得继续探索的领域。


巩佳辉介绍了本次会议的Workshop,Sustainable Mobility Workshop中,想要通过探究通过更环保的技术来减少空间和能源的消耗。并提出两个问题:1. 如何在不投入时间和金钱进行机动化出行的情况下,让生活的基本功能变得可及?(15分钟城市)2. 通用框架如何支持向更本地化生活方式的行为转变?他们想通过这次Workshop来提高人们的环保意识。

图片可左右滑动


Human Mobility Challenge Workshop是关于人类出行模式最新计算模型的比赛结果的Workshop,比赛的前十名队伍分享了他们使用的方法并回答提问,其中有使用了树模型构造特征的方法,有使用了seq-seq的encoder-decoder结构,有对大模型finetune进行人类轨迹预测的方法,这些理解、建模和预测城市地区人口流动轨迹的方法可以在交通建模、灾害风险管理和城市规划等各个领域提供有效的帮助。

图片可左右滑动


明年的 SIGSPATIAL 会议将在美国亚特兰大举办,

期待再会!

数据科学与智能实验室
本公众号为清华大学电子系数据科学与智能实验室的公众账号,主要推送实验室重要通知、日常活动、文章导读、前沿分享等资讯,敬请关注。
 最新文章