PB级数据时代的数据驱动服务规划:以德克萨斯州阿灵顿市为例(Data-driven service planning in the Petabyte Age: the case of Arlington, Texas)
Jianling Li, Yuan Zhou & Xinyue Ye
全球各城市积累了大量数据,如何将这些大数据转化为有意义的知识是一个较大的挑战。以便为城市的战略决策提供信息支持,并增强城市可持续性。与这一挑战相关的还有关于千万亿字节时代中“群体智慧”的讨论。本文以德克萨斯州阿灵顿市为案例,探索了一种结合群体智慧和空间学习技术的混合社会调查方法,以利用数据开发预测模型,支持城市的服务规划。研究结果表明,服务需求存在时间和空间模式,法规合规需求与供水服务需求之间存在空间相关性,同时与邻里特征也有一定关联。这些发现为进一步整合数据、数据挖掘、组织合作和资源管理提供了机会,从而提高城市服务提供的效率。
引用
Li, Jianling, Yuan Zhou, and Xinyue Ye. "Data-driven service planning in the Petabyte Age: the case of Arlington, Texas." Urban Informatics 2.1 (2023): 5.
https://doi.org/10.1007/s44212-023-00030-8
1.引言
城市的主要目标之一是为其居民、企业及游客提供高质量的生活环境,并实现可持续发展。这一目标的实现需要基于千万亿字节时代生成的大数据进行积极的规划与管理。信息与通信技术的进步,使得21世纪的全球城市能够生成海量且多样化的数据。然而,关键挑战在于如何将这些数据转化为有意义的知识,以支持城市的战略规划、服务供给和资源配置决策。尽管在交通、公共卫生、安全等多个领域的服务规划中已广泛应用数据技术,但其在法规合规服务规划中的应用仍较为有限。此外,关于“群体智慧”在城市服务规划中的作用,目前尚缺乏深入研究和理解。
2.研究方法
2.1研究过程
基于此,本文以德克萨斯州阿灵顿市为案例,探索了一种结合群体智慧和空间数据驱动技术的混合分析方法,结合了“群体智慧”用于数据挖掘和传统的科学模型来预测法规违规情况(见图1)。本文将“群体智慧”视为一种归纳性研究工具。首先采用归纳方法来探索“群体智慧”倡导者提出的社会现象之间的相关性,然后采用演绎方法来研究第一阶段发现的关联。以城市服务规划为例,第一阶段包括分析服务请求的原始数据以检查其时空模式,与 “街头知识 ”者分享调查结果,以揭示问题的本质,然后对观察到的模式进行理论推理。在第二阶段,根据第一阶段的发现以及相关理论或文献中的经验发现提出假设。基于这些假设,选择相关因素,测试它们的关系,并确认或否定解释。
图1.一般研究方法
2.2研究区域与数据
本文使用了由阿灵顿市提供的2016年法规合规呼叫记录和停水数据。法规合规数据集包括事件报告的日期、相关物业的地址、违规类型、物业的分区类型以及与法规合规服务相关的其他数据。停水数据集则包括房产地址和与个别记录相关的停水日期。法规违规的总案件数为37,536例,停水记录的总数为10,298例。此外,从美国人口普查局收集了2016年美国社区调查五年估计数据。同时,从北德克萨斯州政府协会收集了额外的数据。
2.3分析工具
本文运用地理信息系统映射和机器学习技术作为本文的数据发现与分析工具。利用ArcGIS对城市服务事件的地址进行地理编码,构建研究数据库。同时,使用ArcGIS中的热点分析工具对城市服务呼叫的空间模式进行分析,其提供了形成服务需求属性假设的基础,并筛选出适用于统计检验的数据。此外,本文采用了ArcGIS提供的森林分类与回归工具开展统计建模。
3.从群体智慧中发现知识
3.1违规行为类型与时间分布
根据阿灵顿市的数据,违规行为分为94类。大多数报告的违规行为属于8个违规类别,所有这些主要违规行为都与财产有关,它们加起来约占侵犯行为总数的73%。数据显示,违规行为呈现明显的季节性分布特点。具体来说,在夏季气温高时,报告的违规行为数量较多,而在冬季气温低时则较少。且违规行为与用水量和停水事件的结果相比,具有相似但不相同的时间模式。
3.2城市服务需求的空间格局
前面的结果表明,对法规合规需求与停水事件之间存在可以想象的相关性。进一步分析指出,对法规合规服务需求的空间模式与停水服务的空间模式非常相似,且停水事件的空间模式与法规合规服务的呼叫模式非常相似(见图2)。
图2. 违规行为与停水事件的聚类分析
4.观察与理论的融合
4.1假设
总体而言,社区的社会经济特征,包括教育、年龄、家庭收入和类型,以及住房占用特征,与需要城市服务的违规行为的季节性和空间模式相关。结合社会均衡理论,假设代表个人及其家庭经济福祉的特征是与违规行为相关的关键因素(见图3)。具体而言,较高的收入和教育水平通常与较少的违规行为相关联;老年人口比例较高时,违规行为更为常见,因为老年人在照顾财产方面存在身体限制;社区中自有住房比例越高,报告的违规行为也越多;反之,租房比例较高时,违规行为的报告率较低,因为租房者对周围环境的关注度较低。此外,停水服务的需求被视为与违规行为存在正相关的因素。
图3. 假设
4.2分析结果
本文测试了两个模型:一个仅包括文献中已被证明与因变量有关的变量,另一个则加入了供水服务数据。结果显示,加入供水服务中的停水事件数据能显著提高模型的预测能力,且停水服务需求成为了预测法规违规行为的最重要因素。
5.讨论
5.1关于“群体智慧”的争论
有人反对放弃理论而仅依赖大数据的相关性分析,但一些学者认为信息通信技术为社会研究带来了机会,主张将大数据和小数据相结合,以推动研究进展。尽管大数据带来变革,但完全依赖经验主义的分析存在风险,因此需要混合理论驱动和数据分析的方法来加深现象的理解。
5.2“群体智慧”在城市服务规划中的作用
研究表明,停水数据有助于提高违规行为的预测能力,体现了数据驱动方法在发现社会现象中的潜力。这同样强调了跨部门协作和集中管理对提升城市服务效率的潜力,尤其是在有限的资源下,通过更好的协调可以减少重复工作和提高响应速度。
5.3机器学习在城市研究中的应用
尽管在科学和工程领域已有所应用,但机器学习在城市研究中仍处于初期阶段。近年来,一些研究利用空间机器学习技术进行城市犯罪预测、零售销售与天气的关联分析等,展示了这一方法在社会科学研究中的潜力。本研究为城市规划、管理和政策制定提供了新的思路,以增强城市的经济竞争力和安全性。
总结与展望
本文揭示了由阿灵顿市生成的服务数据的时空模式。这种群体智慧结合了解社区背景的“街头知识”,为预测违规行为的理论形成提供了见解。在“社会均衡”框架下,研究探索了将服务数据与人口普查数据关联的可能性,并证明利用供水服务数据可以提高预测模型对未来法规合规服务需求的解释力。通过数据驱动范式利用服务数据进行预测建模,是对传统科学模型的一大突破。基于森林分类与回归工具,本文展示了机器学习工具在城市规划和城市管理中的一种新颖应用。
Jianling Li,德克萨斯大学阿灵顿分校建筑、规划与公共事务学院城市规划教授。研究领域包括交通的经济、社会生态、健康和安全影响,交通融资政策,协同规划,通过数据驱动的发现对城市服务进行前瞻性规划和管理,交通项目的成本/效益分析,以及交通政策和技术发展对出行行为的影响。
https://www.uta.edu/academics/faculty/profile?username=jianli
Yuan Zhou,德克萨斯大学阿灵顿分校工业、制造与系统工程系的助理教授。研究兴趣包括医疗运营、公共卫生、建模与仿真(离散事件和基于代理的建模和仿真)。
https://www.uta.edu/academics/faculty/profile?username=zhouy2
Xinyue Ye,德克萨斯农工大学Harold L. Adams城市规划讲座教授,地理空间科学、应用与技术中心主任。研究兴趣在于结合计算社会科学、城市数据科学与地理空间人工智能,旨在应对基础设施韧性、气候变化、社会正义及社区认知等关键问题,强调技术、政策与人类行为在塑造可持续且宜居城市中的动态互动。
https://www.arch.tamu.edu/staff/xinyue-ye
END
编辑:王皓天、梁泽欣
审核/指导:李丹丹