编者按
本文的研究结果可用于分析城市中的人流、交通流、信息流,也可以作为人文地理中“流空间”的理论分析工具。
《地球信息科学学报》
一个系统中物质、信息、能量等在不同空间位置之间的移动或交换形成地理流(Geographical Flow),如城市区域之间的职住流、手机用户之间通话的信息流以及不同位置商业实体之间的资金流等。网络时代的到来,位置之间各种流的出现与强化,改变了以距离衰减效应为基本规律的传统空间认知,距离不再是解释空间相关的唯一测度(例如,因为轨道交通,与某人住处关系更紧密的可能是远处的工作地,而非周围的场所)。各种流的存在重新塑造着地理空间格局,并成为推动地理系统演化的关键因素。
英国伦敦出租车OD流
(来源https://uclab.fh-potsdam.de/)
针对地理流的研究有助于理解地理系统的格局与功能,弄清地理系统演化的动力学机制,故而将成为地理格局与机理分析的新视角。为此,本文突破传统的理论框架,试图构建新的流空间概念与分析框架,并对流模式分类进行较为系统的探讨。
如果仅考虑空间信息,流可以用由起点(O)和终点(D)组成的有序点对多元组表达。令O点坐标为(x(O),y(O)),D点坐标为(x(D),y(D)),则流F可表示为(x(O),y(O)),(x(D),y(D))。因此,流可看作为一个四维对象,而以流作为基本元素构成的空间则称为流空间。流空间是一个四维空间,但由于流的O点和D点有明确的地理含义,即流事件发生的起点和终点,因而不能简单把流空间看成四维欧氏空间。为了方便对流空间的四维特征进行刻画,同时又不割裂流的地理内涵,可用两个二维平面的笛卡尔积(R2×R2)的形式定义流空间。
根据流及流空间的定义,可以定义流的距离、流的方向、流的邻域的体积和流的密度等用于描述流的空间分布特征的基本指标。其中,流的距离由流的O点和D点之间的距离(图3)组合(如加和、平均等)确定,流的方向指从流的O点到D点的有向连接的方向,流的邻域的体积指以一条流为中心、半径为r的邻域在流空间中对应的体积,而流的密度指流空间中单位体积内流的数目。
空间点的分布模式主要可分为3种:丛集、随机和排斥。一个空间点集必定是上述3种模式的组合。如果采用起点、角度、长度的方式表达流,则其中3个因子也同理分别可以表现为以上3种模式,而3个因子的3个模式组合可以得到27种流模式。在这27种模式中,具有地理意义且较为常见的模式有以下6种:随机(起点随机、方向随机、长度随机)、丛集(起点丛集、方向丛集、长度丛集)、聚散(终点或起点丛集、方向随机或排斥、长度任意)、社区(起点丛集、方向任意、长度丛集)、并行(起点随机、角度丛集、长度任意)与等长模式(起点随机、角度随机、长度丛集)等。流的模式分类为流的空间分析提供了理论框架,在流模式挖掘时,可以这6种模式为目标进行模型设计(限于篇幅,下文仅对前4种进行说明)。
前述均为流的单一模式,而单一模式相互组合还可以产生混合模式。例如,丛集模式与聚散模式组合,形成丛集—聚集模式或者丛集—扩散模式。这种模式的典型例子是交通枢纽及不同枢纽之间的出租车OD流(丛集模式由交通枢纽之间的出租车OD流形成,而聚散模式又由交通枢纽与周边区域的客流形成)。
社区模式与聚散模式可以形成社区—聚散模式。这种模式可以表现为学区内的学生产生的家庭—学校的上下学流。
丛集模式也可以和社区模式结合,形成丛集—社区模式,该模式可以表现为城市功能区内部热点之间的出租车流。
当不同类型的流共存时,可能形成多元流模式。以数据中存在2种类型的流为例,它们之间的模式主要表现为3种:相关模式、排斥模式和独立模式。
相关模式是指在一定空间邻域范围内2种流频繁成组出现的现象。流的相关包括正相关和负相关。其中,流的正相关是指成对出现的流的O点与O点邻近、D点与D点邻近,流的负相关则相反。
排斥模式是指一种流的局部范围内不存在或者较少存在另一种流的模式。
独立模式是指两种流之间的分布独立,即任意一种流在局部范围内的出现不以另一种流的出现为先决条件。
对于多元流的相关、随机与排斥模式,均可以采用从点的cross K函数扩展而来的流的cross K函数进行判别。
实例:流的丛集模式提取
针对上述流模式中的丛集模式,相关研究提出了流密度域分解的概念,并以此为基础提出了一种对任意形状的流丛集进行聚类的方法。该方法的思想是:针对一个流数据集,首先计算其中流的k接邻近距离,得到流的k阶邻近距离的直方图,随后根据期望最大化(EM)算法得到不同流簇的分布参数,最后将这些参数作为密度聚类算法DBSCAN的输入,对流数据集进行聚类,以提取流数据集中的丛集模式(模型流程图如下)。
流的密度域分解模型
将此模型用于北京市出租车OD流丛集模式的提取,结果如下图所示。根据流O、D点的时间和所在位置的城市功能等信息,图中的流丛集可以分为三类,即通勤流丛集(下图a和b)、返程流丛集(下图c和d)、节假日出行流丛集(下图e中的国庆旅游出行流和f中的清明节八宝山扫墓出行流)。
北京市六个不同研究区出租车OD流丛集
此实例详细内容已发表,引用格式为:
Song C, Pei T, Shu H. Identifying flow clusters based on density domain decomposition[J]. IEEE Access, 2019, 8: 5236-5243.
原文请到中国知网下载
作者简介
中国科学院地理科学与资源研究所研究员,博士生导师,资源与环境信息系统国家重点实验室副主任,中国科学院大学岗位教授,近年来主持国家重点研发项目等10余项,研究兴趣为地理大数据挖掘。
《地球信息科学学报》是由中国科学院地理科学与资源研究所和中国地理学会联合主办,由中国科学院资源与环境信息系统国家重点实验室、虚拟地理环境教育部重点实验室(南京师范大学)、三维信息获取与应用教育部重点实验室(首都师范大学)共同协办的学术期刊。学报为月刊,是中国科学引文数据库(CSCD)核心期刊、中国科技核心期刊、全国中文核心期刊、北大《中文核心期刊要目总览》来源期刊。《2018年版中国科技期刊引证报告(核心版)》显示,《地球信息科学学报》影响因子位列测绘科学技术期刊第3名,综合评价总分位列第4名。
欢迎国内外学者踊跃赐稿,欢迎国家重大科研项目、国内外学术会议组织专辑专栏。
官网网址
http://www.dqxxkx.cn/CN/1560-8999/home.shtml
联系电话
010-64888891
邮 箱
dqxxkx@igsnrr.ac.cn
长
按
关
注
策划创意:耿艳辉
编辑:耿艳辉,舒华
制作:D+工作室
校对:黄光玉,蒋树芳