城市信息学中的数字孪生
(Digital twins in urban informatics)
Michael F. Goodchild, Dylan Connor, A. Stewart Fotheringham, Amy Frazier, Peter Kedron, Wenwen Li & Daoqin Tong
城市信息学似乎是数字孪生应用的一个合适领域。虽然该术语的定义具有一些共同特征,但对于数字孪生的确切构成尚未达成一致。如果不充分关注任何真实系统复制品所固有的不确定性,该术语可能会引起误解。本文探讨了不确定性的问题,以及导致其量化困难的一些问题。用于城市信息学的数字孪生还提出了目的、治理和伦理等方面的质疑。在最后一部分,文章提出了一些需要解决的研究问题,以确保数字孪生能够取得成功。
引用
Goodchild, M. F., Connor, D., Fotheringham, A. S., Frazier, A., Kedron, P., Li, W., & Tong, D. (2024). Digital twins in urban informatics. Urban informatics, 3(1), 16.
https://doi.org/10.1007/s44212-024-00048-6
1. 引言
“数字孪生”这一术语现已在城市信息学领域牢固确立:已出现多篇论文,商业公司使用该术语来宣传其产品,大量的“数字孪生”为主题的研讨会也被举行。然而,在城市信息学领域仍然存在许多不确定性,包括该术语的定义、数字孪生的目的、数字孪生的所有权和治理,以及用户对其模型和预测的信任程度。本文旨在澄清“数字孪生”术语中的许多问题,确定当前的研究需求和未解答的问题,鼓励公开讨论,以提高对数字孪生引发的伦理问题的认识,并明确今后如何更好地为数字孪生在城市信息学中的开发和成功应用做准备。
2023 年 2 月,亚利桑那州立大学地理科学与城市规划学院的空间分析研究中心 (SPARC) 组织了一场关于数字孪生的研讨会,其中包括来自世界各地的八位主题演讲人、闪电演讲和延伸讨论。本文的第二部分讨论了定义问题,以及该术语在制造业中的首次使用与其在地球科学和城市信息学中的应用之间的关系。第三部分是对数字表示的准确性以及所有数据源和用于预测的模型中存在的不确定性的广泛讨论(回顾乔治·博克斯的名言“所有模型都是错误的,但有些是有用的”)。本文的第四部分讨论了治理、所有权、道德以及数字孪生预测信任的潜在因素等更广泛的背景问题数字孪生的使用以及该术语本身的使用提出了许多道德问题,尽管其中一些问题可以通过技术解决方案解决,但更广泛地说,数字孪生的设计者、开发者和用户必须承担起确保实践合乎道德的责任。本文的最后一部分探讨了要实现数字孪生的愿景需要解决的研究问题。本文还对如何教育下一代数字孪生开发者和用户进行了评论。
整篇论文假设所讨论的数字孪生都是与地理空间相关的:也就是说,它们通过用于描述位置的数据、所应用的模型和所做的预测来区分位置。因此,本文中的数字孪生与 GIS 技术密切相关。这与 Esri 的断言一致:“数字孪生是现实世界的虚拟表示,包括物理对象、过程、关系和行为。GIS 创建了自然环境和建筑环境的数字孪生,并以独特的方式集成了多种类型的数字模型。
2. 定义
“数字孪生”(Digital Twin)概念最早出现在2000年,源于工业设计和制造领域。Grieves(2016)的定义指出,数字孪生是一组虚拟信息结构,能够从微观原子级别到宏观几何级别完整描述潜在或实际的物理产品,并且从数字孪生中获取的信息与检查物理产品时获得的相同。虽然定义强调了对物理系统的完美复制,但在实际操作中,这种“完美”无法实现,尤其是在城市信息学等领域。相反,需要确定在某一具体使用场景下,数字孪生能提供的精度水平,以确保其满足应用需求,通常称为“适用性”。
数字孪生不仅涉及对物理形态的复制,还包括对控制和修改过程的数字化表示。许多定义还强调了数字孪生与其物理系统的双向关系,既可以用于预测物理系统的未来状态,也可以通过物理系统的实时反馈不断更新和修正数字孪生的内容。尽管大多数定义都集中于其“复制”功能,但数字孪生还可以应用于不同目的,如监控、建模、预测,甚至是自主学习。
在虚拟系统中进行实验可以避免物理系统中可能面临的严重风险,例如航空航天设计中的失败。此外,数字孪生在训练外科医生、环境保护以及预测人类活动对地球系统的影响等方面有着显著优势。然而,数字孪生的建设和操作成本较高,因此它的价值必须在精度、成本和应用效益之间进行平衡。
综上,数字孪生的潜力不仅在于其作为物理系统的虚拟复制,更在于其在决策支持、数据管理和模拟实验中的广泛应用,尤其是在城市信息学等领域。
3. 准确性
数字孪生的“孪生”概念暗示其与现实世界的高度相似性,但事实上,数字孪生与真实系统之间并没有直接的“基因联系”。因此,数字孪生只能是对物理系统的近似,而不可能完全复制其每个细节。这意味着,数字孪生在某些信息上可能通过图灵测试,而在其他方面则无法通过。为了使数字孪生在实际应用中可行,必须对其不确定性进行量化,从而评估其预测的精度。
这种不确定性源自多个方面,首先是地理概念的定义不严格。例如,在城市数字孪生中,什么是“社区”?社区的边界往往基于行政划分,但实际中的边界可能并不清晰。因此,不确定性部分源自这些空间单位的定义问题。其次,地理信息中几乎总是存在正空间依赖性,即相近位置的信息更相似,这使得误差在空间上具有相关性,进而影响数据分析的自由度。这种空间依赖性会挑战传统统计学中的独立性假设,增加数字孪生中误差传播的复杂性。
此外,数字孪生的预测能力也存在不确定性。要准确量化这一不确定性,必须找到能够与现实世界相对应的高精度数据源或更精细的空间分辨率数据。但在许多情况下,并不存在绝对正确的参考数据,尤其是对动态数字孪生来说,预测未来时的有效不确定性量化非常困难,甚至不可能实现。
不确定性的传播也会受到输入数据的质量和模型本身内在不准确性的影响。为了应对这一问题,可以使用一些不确定性传播方法,但这些方法往往基于严格的假设,可能难以适应现实中的复杂情况。例如,不同数据集可能来源于同一数据源,从而继承相同的误差,而其他数据集则可能来自独立来源,这在不确定性传播时需要区分对待。
可视化不确定性也是一种有效的沟通方式,但研究表明,这种方法存在许多问题。例如,强正空间依赖性很难可视化,而在使用动画时,尽管效果较好,但仍需伴随明确的说明,避免用户误解。将不确定性融入地图(如模糊处理或灰化显示)是常用手段,但必须明确告知用户,以防止其错误地认为地图是精确的。
总之,尽管在数字孪生中识别和量化不确定性至关重要,但这在实践中是一个极具挑战性的任务。尽管已有大量文献讨论了这一问题,但大多数研究较为数学化,难以被普通用户理解。因此,如何有效处理数字孪生中的不确定性问题,仍是一个亟需解决的复杂课题。
4. 背景问题
4.1 目的
数字孪生可以有多个用途,最常见的是用于预测。通过数字孪生,用户能够预测规划决策的效果,这些预测可以是实时的,例如在交通应急管理中,或者是长期的,例如住房开发或化石燃料燃烧对环境的影响。为了实现这种预测,数字孪生需要具备快速处理实时输入数据的能力,并在计算精度和计算时间之间取得平衡,特别是在紧急情况下,计算速度必须快于实际变化的速度。数字孪生的另一个重要用途是作为数据存储库,它可以为研究者和城市管理者提供统一且易于访问的数据平台。这对于促进数据的长期保存、共享和进一步研究具有重大价值。此外,数字孪生还有助于提高城市信息的透明度,使市民、社区团体和政府部门能够更便捷地获取和理解相关信息。
4.2 治理
数字孪生的建设和运作涉及多个利益相关者,尤其在数据获取和共享方面面临巨大挑战。数字孪生需要从多个来源收集数据,包括城市管理部门、私人公司(如公用事业公司)和第三方,这些数据往往由不同的利益方持有,且部分数据可能因隐私或商业原因难以共享。尽管部分城市已建立数据共享门户,但距离数字孪生所要求的普遍数据可得性仍有很大差距。此外,模型的获取和共享也存在类似问题,许多模型受制于知识产权或专有技术,难以公开获取。即使是能够获得的模型,它们也可能在数据来源和假设方面存在差异,这导致选择模型进行预测时,准确性、计算需求和成本等方面难以统一。因此,数字孪生的治理不仅涉及数据的管理,还包括如何在不同的预测模型和空间范围之间平衡与选择。
4.3 伦理
数字孪生在其设计和应用过程中涉及多个伦理问题。首先,忽视预测中的不确定性并将其结果视为完美是不道德的,特别是当数字孪生以“孪生”的名义容易给人过高期望时。此外,数字孪生用于模拟个人行为时,可能涉及隐私问题,如何保护个人隐私是一个关键挑战。数据聚合可以解决隐私问题,但这往往会损失空间和时间的细节,影响预测精度。另一个伦理问题在于透明度,复杂的数字孪生往往缺乏透明度,数据的来源可能不清楚,预处理过程可能没有完整记录,尤其是使用人工智能时,模型的黑箱性会进一步增加透明度的缺失。为了减少伦理风险,可以使用技术手段在用户界面中加以控制,例如防止使用者查询涉及个人隐私的数据,或通过不确定性提示帮助使用者正确地解读结果。
尽管数字孪生的概念已经有很长历史,最早的模型是物理比例模型,但随着数字技术和高分辨率数据的普及,数字孪生作为一种精确复制现实世界的手段正在受到越来越多的关注。特别是在城市信息学中,基于数字孪生的精细化数据采集(如LiDAR技术)已广泛应用于城市规划。然而,数字孪生在真实过程建模和预测方面仍有很大的发展空间,尤其是如何处理城市的社会行为、交通基础设施和长期发展等更复杂的问题。
针对数字孪生未来的研究方向,作者提出了以下几点:
数据库构建:数字孪生依赖大量的高质量数据,然而,如何有效地集成和融合不同来源的数据仍然是一个挑战。研究需要进一步探讨数据集的重采样和缩放方法,并处理由此带来的不确定性问题。
过程模型的搜索与选择:数字孪生的核心在于其背后的过程模型。研究需要开发更好的模型描述方法(模型元数据),记录模型的来源,并评估其不确定性。同时,模型的选择标准、计算需求和预测精度等也亟待系统化研究。
模型的互操作性:如何让不同的模型在数字孪生中协同工作,尤其是在模拟不同的空间和时间尺度时,是未来研究的重要方向。这关系到如何在动态模型中集成不同的分辨率与时空尺度。
数字孪生的描述标准:需要制定数字孪生的标准化描述方法,如地理覆盖范围、适用场景、不确定性评估方法、空间和时间分辨率等,以便于未来的推广和使用。
用户体验:数字孪生的用户界面需要根据不同的用户类型和应用场景进行设计。同时,如何在界面中保护数据隐私、提示可能的不道德行为,或帮助用户理解预测结果中的不确定性,也是未来的研究重点。
最后,作者指出,数字孪生的定义和使用在城市信息学中仍存在争议,特别是在如何平衡数据、模型和用户界面之间的复杂关系上。数字孪生概念的滥用可能会导致不切实际的期望,但同时,若能解决相关的技术与伦理问题,它将为社会科学和环境科学带来巨大变革。
Michael Goodchild,加州大学圣塔芭芭拉分校的地理学荣休教授。截至2012年,一直担任 Jack and Laura Dangermond地理学讲座教授,并担任加州大学圣塔芭芭拉分校空间研究中心主任。《城市信息学》美洲区编辑。他于1965年在剑桥大学获得物理学学士学位,1969年在麦克马斯特大学获得地理学博士学位。他的研究和教学兴趣集中在地理信息科学的问题上,包括地理信息的不确定性,离散的全球网格,以及志愿者地理信息。他曾主持过多个大型的资助项目,包括国家地理信息和分析中心、亚历山大数字图书馆和空间整合社会科学中心。他于2002年当选为美国国家科学院院士,2010年当选为英国皇家学会外籍院士和英国科学院通讯院士;2007年获得地理学最高荣誉Prix Vautrin Lud奖。出版书籍、文章550余部/篇。2012年退休后移居西雅图,目前担任亚利桑那州立大学兼职研究教授、香港理工大学杰出讲座教授。
https://www.geog.ucsb.edu/people/faculty/michael-goodchild
Dylan Connor,亚利桑那州立大学地理科学与城市规划学院副教授,空间分析研究中心 (SPARC) 的核心教师。作为一名计算社会科学家和地理学家,Connor博士研究地点如何影响人类发展、社会不平等以及在漫长的历史时期中优势和劣势的传递。他专门研究因果推理以及历史和空间数据基础设施。除了方法论方面的贡献外,他还发表了大量著作,主题包括美国梦的地理变化、空间财富不平等、农村社会流动性优势以及爱尔兰和犹太移民的经济史。
https://search.asu.edu/profile/1887290
A. Stewart Fotheringham,亚利桑那州立大学计算空间科学董事讲席教授,地理科学与城市规划学院空间分析研究中心主任。在空间交互建模和局部统计分析领域享有盛誉;后者是多尺度地理加权回归的开发者之一。他对健康数据、犯罪模式、零售和移民有着浓厚的兴趣。2013年,当选为美国国家科学院院士。
https://www.asu.edu/academics/faculty-excellence/spotlight/A.%20Stewart%20Fotheringham
Amy Frazier,加州大学圣塔芭芭拉分校教授,Jack and Laura Dangermond保护科学主席。Frazier 博士的研究重点是整合遥感、GIS 和景观生态学来研究全球环境变化,特别是防止生物多样性和生态系统服务的丧失。
https://www.geog.ucsb.edu/people/faculty/amy-frazier
Peter Kedron,加州大学圣塔芭芭拉分校副教授,人文地理学家和 GIS 科学家,拥有经济地理学、空间分析以及研究设计和评估方面的专业知识。研究开发并使用空间分析方法来解释社会和生态过程中的地理变化。最近的工作重点是使用复制作为评估地理研究的手段,以及开发统计方法来改善从不同地点收集的证据的积累。
https://www.geog.ucsb.edu/people/faculty/peter-kedron
Wenwen Li,亚利桑那州立大学教授,地理科学与城市规划学院网络基础设施和计算智能实验室的负责人。研究兴趣为地理信息科学,重点是网络基础设施、大数据、语义互操作性、空间信息检索和分布式地理空间信息处理。
旨在开发集成、可持续和智能的网络基础设施,以彻底改变数据和计算密集型地理科学中的知识发现。希望利用最先进的语义技术来改善分布式GIS数据、分析工具和模型的访问、集成和时空推理。https://search.asu.edu/profile/1978357
Daoqin Tong,亚利桑那州立大学教授。研究主要集中于使用空间分析,包括空间优化、地理信息系统(GIS)、空间统计和大数据,以支持有关位置决策、交通、食品获取和公共卫生的城市和区域研究。最近的项目包括对空间数据不确定性进行建模、替代燃料位置的协作地理设计、对不同空间尺度上媒介传播疾病的传播进行建模、分析城市粮食获取和城市农业问题,以及研究雨水作为沙漠城市水独立的潜在资源。
https://search.asu.edu/profile/3174976
END
编辑:肖之阳
审核/指导:李舒阳