商业业态的时间运营特征是城市居民生活时序的重要表征。然而,在空间单元内部,由于存在多个具有异质性经营时段的商业主体,构建科学的量化方法以刻画这种复合型时间特征,是揭示居民生活习惯空间分异规律的前提。尽管如此,现有研究尚缺乏对此类时空复合特征的量化表达方法和分析其空间异质性的框架。
为此,本研究 ① 提出了将设施运营属性转化为空间时间序列数据(设施运营率曲线)的方法;② 定义了“Urban Schedule”这一新概念,表示区域内由多条设施运营率曲线共同组成的特定空间属性分布模式;③ 刻画了上海市中心城市规划的空间特征,揭示了城市规划与城市功能区的对应关系。本研究的核心贡献在于:
(1) 通过将兴趣点(POI)属性数据转化为Time-OD数据,从而生成空间时序(如设施的营业概率曲线)。这一方法克服了以往研究中数据获取和运营时间特征表达的局限性,为城市动态功能研究提供了精细化的数据和表达方法支撑。
(2) 提出了“城市日程”(Urban Schedule)的概念,用以描述某一地区多个时间序列的集合所形成的地理模式。这一概念揭示了居民动态生活习惯的时间空间分布特点,并与区域的功能区划相对应,进一步丰富了空间时间序列研究的理论框架。
(3) 引入了地理过程分区方法,这一方法结合了空间连续性和时间序列相似性的特征,成功地在上海市中心区的分析中揭示了居民动态生活习惯的空间分异,及其与城市功能区之间的对应关系,对城市规划和功能区划分具有重要的指导意义。
该研究由南京师范大学、中国科学院地理科学与资源研究所的一众学者共同完成,以“A time-series-based model to detect homogeneous regions of residents' dynamic living habits”为题,在信息地理学主流期刊《Geo-spatial Information Science》发表。
论文引用格式:
Haoran Wang, Haiping Zhang*, Nuozhou Shen, Fei Zhao, Hui Zhu, Shangjing Jiang, Guoan Tang & Liyang Xiong (2024): A time-series-based model to detect homogeneous regions of residents’ dynamic living habits, Geo-spatial Information Science.
DOI: 10.1080/10095020.2024.2437254
滑动查看更多图片
1 概念定义
1.1 包含位置的时间OD
空间 OD: 空间OD是指地理空间中由起点和终点定义的空间流。这种流表示空间中位置对之间物质、信息或特定地理关系的移动。它广泛应用于交通分析、流量预测和探索空间关系的研究。
时空OD: 时空 OD通常涉及给定状态下地理对象的不同起点和终点位置。然而,在实践中,有些情况下地理对象的起点和终点位置在特定状态下保持不变。
时间OD: 时间OD表示两个地理事件在时间维度上的关系,起点为地理事件发生时间,终点为地理事件结束时间,两点构成的OD在一维时间轴上占据特定位置。
包含位置的时间OD: 带位置的时间OD强调某个状态从开始到结束的持续时间,并将这个持续时间锚定在空间位置上,是时间OD的空间增强形式。虽然这一视角长期以来被忽视,但它在建模地理过程和揭示地理现象方面具有巨大的潜力,值得更多关注。当一个地区包含多个这样的包含空间位置的时间OD时,它可以反映该地区人类活动的时间表,例如餐馆的营业时间。为了避免歧义和提高可读性,本研究将“包含位置的时间OD”统一称为“时间OD”。
1.2 提出Urban Schedule
Urban schedule:城市时间表(城市日程) 描述的是城市区域内受地理事件集合影响的人类活动行为模式,如图1(c)所示。这些规律由多个时间OD组成,反映了城市居民在不同时间段的偏好,类似于城市的时间表,因此本研究将其称之为Urban schedule。
图1 相关定义及概念图示
2 方法框架
2.1 总体流程
如图2所示,模型工作流程包括三个部分:数据转换、时间序列属性构建和基于时间序列数据的同质区域检测。第一步,从美团APP收集设施信息,并将其分为六种人类活动类型:餐饮、医疗、运动、购物、学习和休闲。第二步,从兴趣点(POI)中提取营业时间信息,并将其转换为时间-OD数据格式并将其转化为空间时序曲线。第三步,应用动态时间弯曲(DTW)方法计算概率分布曲线之间的值和形状相似性。然后将最小地理单元视为顶点,以概率分布曲线的相似性作为边权重,以构建空间邻接网络,最后将研究区域划分为多个时序属性同质区。
图2 研究总体流程示意图
2.2 时序相似性测度
本节介绍用于计算时间序列数据之间相似度的动态时间规整(DTW)算法。与传统欧氏距离不同,DTW 算法并不局限于比较两个时间序列数据中的对应点,而是分别识别每个时间序列中的特征点,并应用动态规划来计算相似度。因此在本研究中,DTW方法被认为比传统方法(如欧几里得距离)更适用于研究和分析目的。
图3 DTW相似度计算方法示意图
2.3 地理过程同质区探测
提出了一种基于时序属性相似性的地理分区方法来实现同质区的挖掘,使用图4中的示例数据集进行了演示。该方法涉及七个步骤,首先,依据设施营业信息构建空间时序属性;第二步,以每个区域的中心点作为顶点,以区域间的时间相似性作为边的权重,构建加权邻接网络;第三步,计算其自身与相邻节点的时间相似性,并与最相似的节点合并。在合并过程中,算法会继续评估多个地理单元之间的相似性,并将其与单个单元的相似性进行比较,以确定是合并单个单元还是合并一组地理单元。新加入的节点将继续执行相同的操作,直到分区过程完成(步骤4、5和6)。在同一地理区域内,空间时间序列数据表现出相似的模式。
图4 基于时序属性相似性的地理分区方法示意图
3 应用案例分析
3.1 样区与方法
本研究的案例使用来自美团平台的上海市中心城区主要生活设施营业数据,分别包含餐饮、医疗、体育、购物、学习和娱乐等六种主要的生活服务设施,其空间分布如图5所示。
图5 六类营业设施空间分布图
3.2 分析结果
利用设施的营业数据构建街区单元尺度的设施营业概率曲线,并利用所提出的基于空间时序属性相似性的分区方法进行同质区的挖掘,结果如图6所示。在总体上,上海市中心城区的主要区域表现出较为明显的同质性,说明对于中心城区的居民往往存在类似的生活习惯特征。在细节上可以明显观察到,在6种主要设施的过程分区结果中,存在5个相对特殊的同质区,其在餐饮、医疗、体育、购物、学习和娱乐等多种设施营业动态过程分区中都保持稳定,该现象说明这些区域存在与周边完全不同的居民生活习惯模式。
图6 六类设施运营动态过程分区结果
在此基础上,本研究选择使用建筑物类型数据集对这些稳定区域的产生原因进行探究,如图7所示。从下表中我们可以看出,分区2以工业建筑(32.73%)和公寓(32.73%)为主,且比例极为接近;而分区3中艺术建筑的高达89.08%,表明它可能与上海的文化休闲功能有关。分区4以大学(46.09%)和学生宿舍 (37.39%)为主;分区5的居民楼比例达到了97.44%,表明它是一个长期的居住区。最后,分区6的公寓(78.59%)占据绝对主导,居民楼比例次之(18.59%)表明它是一个以短期居住为主的区域。
图7 稳定同质区内部建筑物比例分布
进一步,本研究对各个同质区内Urban Schedule的模式进行了分析探讨(图8)。中心工业区(分区2)在凌晨2点至4点的休闲设施营业概率高于平均水平,而在其他时间均低于平均水平。这一现象可能与工业区夜班工人的休闲需求有关。
世博文化园区(分区3)的医疗设施在上午的营业概率高于其他地区,而在下午3点后迅速降低,这可能与文化园区内日间举办的各类活动和展览导致的游客流量变化有关。
大学城(分区4)在一天中的大部分时间内围绕平均水平波动,直到晚上7点后,学习、体育和休闲的营业概率才出现上升,这与中国大学校园内晚间的学术和社交活动密切相关。
长期住宅区(分区5)在工作时间内,所有类型的设施营业概率均低于平均值;而在非工作时间,概率显著增高,这一特点揭示了该区域受到工作通勤行为的较大影响。短期住宅区(分区6)分区5相似,但其非工作时间仅休闲设施的营业概率有明显提升。这一差异可能与邻近江湾-五角场商业区有关,该地区的商业活动和娱乐设施为居住在该区域的人群提供了更多的休闲选择。
图8 稳定同质区Urban Schedule模式分析图
4 结论与展望
4.1 理论与方法贡献
本研究有两大亮点:一是提出了一种用于分析设施活力的空间时序数据构建方法;二是建立了运营率模式与城市功能区之间的对应关系(图9)。首先,GDP、人口、降水量等传统时序数据虽然被广泛使用,但其对于城市内部的小尺度分析往往空间分辨率过大。其次,时序数据的空间维度在地理研究中经常被忽视,导致对此类数据的空间相关性、异质性和区域性的研究不足。
针对这些不足,本研究引入了一种新的概念,称之为城市日程(Urban Schedule),用于表达多个时间序列形成的空间变量模式,以此反映居民日常生活的动态。
利用基于时序属性相似性的地理分区方法,本研究发现运营率模式与城市功能区相对应,表明城市功能影响居民的日常生活。具体而言,工业区居民在夜间表现出更高的娱乐和医疗活动强度。在上海的文化公园地区,工作时间的医疗和学习设施活力明显高于非工作时间。在大学城,运营率模式受上课时间的影响,大多数活动在课后超过平均水平。在住宅区,运营率模式揭示了工作场所和住宅区之间的通勤流量。
无论是在长期居住区还是短期公寓区,工作时间和非工作时间的设施活力都存在显著差异。这些发现为了解城市功能如何塑造居民的生活习惯提供了更深入的见解,并为在小时间尺度上研究城市活力提供了新的视角。
图9 理论与方法贡献
4.2 不足与展望
(1)当同一个地理单元的属性由多个时间序列共同定义时,不仅要考虑地理单元之间的属性相似性,还要考虑单个地理单元内不同时间序列之间的相互关系。具体而言,当使用多个时间序列作为地理属性时,相似性度量应分为两个部分:时间序列的数值相似性和它们之间的内部关系相似性。数值相似性可以使用时间序列相似性算法来解决,而内部关系应由基于相关性的网络结构表示。
(2)对于网络应用平台数据而言,其用户群体以年轻人为主,未来的研究应结合深度学习技术,如利用生成对抗网络(GAN)模拟缺失的老年居民行为,以分析全年龄段的居民行为模式。
(3)研究范围应从城市尺度扩展到国家乃至全球尺度,在更广泛的地理范围内识别具有普遍代表性意义的居民生活习惯模式并分析其空间分布特征与形成机制。
代码共享
论文代码可以从GitHub下载使用,下载地址:
https://github.com/AidenWang0309/Time-series-based-regionalization-method
作者简介:
王浩然 (第一作者) 博士毕业于南京师范大学,主要研究方向为地理分区与区域分析、空间复杂网络建模、地理过程分析与计算。
张海平 (通讯作者) 中国科学院地理科学与资源研究所助理研究员。主要研究方向为时空行为与地理复杂网络分析、地理分区与区域系统建模、社会地理过程模拟与计算。
沈诺舟 南京师范大学硕士研究生,主要从事社会地理过程模拟与建模、空间大数据分析与计算等方面的研究工作。
赵飞 南京师范大学博士在读 主要研究方向为水资源管理,数字地形分析。
朱辉南京师范大学博士生,主要研究方向是城市视觉分析,城市形态,数字地形分析
蒋尚婧 南京师范大学地图学与地理信息系统专业博士生,主要研究方向为城市地理与地图可视化。
汤国安 南京师范大学教授,博士生导师。主要从事空间分析、数字地形分析等方面的研究和教学工作。
熊礼阳 南京师范大学教授,博士生导师。主要从事空间分析、数字地形分析与地貌演化建模等方面的研究和教学工作。
材料整理 | 王浩然
内容排版 | 张海平
内容校审 | 杨 宇
思源流变,测国计策,
能源经济绘新图
关注我们 : 能源与经济地理Lab
联系我们:EnergyEconGeogrLab@163.com