地理时空动态模拟工具介绍(上)

文摘   2025-01-04 22:31   安徽  
地理时空动态模拟系列工具用于模拟土地利用变化过程并预测未来土地利用情景,该工具是由易智瑞公司与中山大学刘小平教授团队合作,基于FLUS模型原理,在GeoScene Pro软件上开发实现的,操作简单,且具有较高的模拟精度。
关于地理时空动态模拟系列工具的介绍将分为上下两篇。上篇主要介绍FLUS模型的基本原理、各模型参数的含义,同时为提高阅读体验,尽量避免涉及相关计算公式;下篇主要介绍地理时空动态模拟工具的使用方法,如果只想快速掌握地理时空动态模拟工具在Pro中如何使用,并评估该工具的精度,可以直接看下篇(今日第二篇) 。
01
FLUS模型的基本原理

FLUS (Future Land Use Simulation model)是模拟人类活动与自然影响下的土地利用变化以及未来土地利用情景的模型。该模型源自元胞自动机(Cellular Automata),并在传统元胞自动机的基础上做了改进。    

先来看什么是元胞自动机,元胞自动机(以下简称CA)是一种时间、空间和状态都离散的网格动力学模型,它具有模拟复杂时空演化过程的能力。CA由规则的元胞网格组成,散布在规则格网中的每一元胞具有有限的离散状态,依据确定的局部规则作同步更新。
上述文字多少有点晦涩,我们可以理解为CA的研究对象是栅格数据,每一个栅格单元(像元)就是一个元胞,元胞有自己的属性值(有限的离散状态),CA研究的内容就是根据转换规则并结合其周围像元情况,更新研究对象的属性值。

图 转换规则不同,属性值不同

在土地利用及其覆被变化领域(LUCC)中,元胞空间代表所有土地的集合,每个元胞有各自的属性(即土地利用类型),每个元胞在下一时刻的状态由该元胞当前状态、其邻域内元胞状态和转换规则共同决定。FLUS模型最重要的内容就是构建复杂的转换规则来改变像元的属性值,最终得到未来土地分布结果。那么它的实现原理是什么样的呢?来看FLUS的概述。
02
FLUS原理
FLUS模型是在神经网络模型基础上,结合自适应惯性竞争机制建立的未来土地利用变化模拟模型。该模型能够有效耦合社会经济要素和自然环境要素,并通过设计不同用地类型间转化矩阵和轮盘赌机制,实现土地利用变化的模拟,较好地弥补了传统元胞自动机方法中局部转换和参数确定复杂等问题。
FLUS模型大致可以概括为三个步骤:首先需要确定各种地类要达到的目标数量,其次就是计算演变过程中各地类转换的总体概率,用于控制转换过程的整体走向,最后就是根据轮盘赌的原则,推断各地类的分布。过程中通过不断地判断预测结果与目标数量是否一致,迭代调整总体概率,直到预测结果与目标数量为止。

图  FLUS大致流程


第一步预设未来各土地利用类型的数量

该数量是FLUS模型演变的目标。FLUS模型基于初始的土地利用栅格数据,结合制定的转换概率以及预测的各类土地用地需求数量,整体迭代推演出未来不同时期土地利用的分布,直到各地类的数量逼近预设的土地类型数量为止,最终以栅格方式输出各土地利用类型具体的空间分布情况。

图 各地类初始及目标数量

那么未来各土地利用类型数量是如何得来的呢?通常需要根据研究区域的实际发展情况,采用专家经验或土地利用数量预测模型进行预测,常见的土地利用数量预测模型包括SD 模型,马尔科夫链,灰色预测模型,线性回归等等,不在我们本次介绍的范围。

第二步提供各地类转换的总体概率

总体概率组成比较复杂,大致可以分为两部分,一是各像元土地利用类型发生变化的概率即适宜性概率,二是其他可变成分概率(包括各地类之间的转换成本、邻域条件及不同土地利用类型之间的竞争因素等),我们依次介绍这几个因子。
适宜性概率
适宜性概率是指对每一个像元,都计算其上的各种土地利用类型的发生概率,值越高说明这个像元是这种土地利用类型的可能性较高。下图说明当前像元是农用地的可能行比较大。

图 适宜性概率

FLUS模型使用ANN法计算适宜性概率,ANN即人工神经网络模型,模拟人脑神经元的工作方式来处理信息,广泛应用于机器学习和深度学习。
如下图所示,ANN分为训练和预测两步骤,首先对数据进行采样,形成训练集,在训练集上进行训练,不断调整模型权重值,目的是使模型能够学习到数据的模式和规律;其次使用训练好的模型对需要预测的对象进行概率预测。

图 ANN结构

ANN训练部分,大概分为三层,依次为输入层、隐藏层和输出层。在土地利用场景中,输入层需要指定输入变量,隐藏层可以简单理解为是黑盒子,其中是各种不可见的算法,负责提取特征和抽象信息,不停改正模型权重,使其接近输出层,输出层为各类土地利用类型。 
这里需要注意,输入变量为研究对象和影响因子。
研究对象是已知的土地利用分类数据,通常要对该数据进行采样获取训练集,进行训练。
影响因子也叫做驱动力数据,一般为社会、经济、交通和自然等空间变量,为了使模型更加准确,影响因子应当尽量丰富。例如自然地形数据可包括高程、坡度、坡向等,交通区位数据可包含到市中心距离、到城镇中心距离、到高速公路距离、到主干道距离、到铁路距离等多种栅格数据,经济数据可包括人口、GDBP等信息,还需要注意上述影响因子需要进行归一化处理,消除量纲的影响,提高模型的泛化能力。
ANN预测部分则根据训练后的权重计算各类土地利用类型的发生概率。
Pro中ANN输出的结果是一个n波段的概率栅格数据,n为输入土地利用分类数据的类别。
其他可变成分概率
在元胞自动机的运行机制中,每个像元是否会发展成一种特定的土地利用类型,不仅取决于由ANN预测的适宜性概率,还取决于在预测期内不同发展状态下的其他可变成分。因此,FLUS模型将适宜性概率与邻域影响因子、转换成本以及自适应惯性系数进行综合,确定每个像元的土地利用总体转换概率。
我们依次介绍上述三种可变成分。
邻域影响因子是指在邻域范围内,当前像元受其他用地单元的影响。邻域影响因子需要考虑两个因素,邻域大小(即范围,通常是3*3、5*5或其他大小的方形或矩形区域)和邻域权重(代表了各地类的扩张强度,即各用地类型在外界因子驱动下使自身得以扩张的能力。这个参数范围为0-1,越接近1,表明其扩张能力越强。)一般格式如下:

图 邻域权重

邻域权重常基于专家知识和一系列模型试验。
转换成本用于表示不同土地利用类型之间相互转换的难易程度,是一个二值矩阵,用于设置土地利用类型的相互转换关系。当一种土地类型允许向另一种类型转化时,对应的转换成本值设置为1;如果不允许转化,则参数设置为0。可以根据实际情况和研究区域的特点来设置转换成本矩阵。例如,可以规定城市用地和水体不能转换为其他用地,耕地不能转换为果园,果园和林地不能相互转换等,成本矩阵如下图所示。

图 转换成本

PS:转换成本分为为刚性 (取值为0或1) 与柔性 (取值为0~1) 两种。本文中采用刚性方法,即非0即1的选择。
自适应惯性系数用于调整当前土地利用的数量,使其按照预设需求进行发展。自适应惯性系数将在特定的土地利用类型的发展趋势与预设目标存在较大差距时,在下一次迭代中调整该土地利用的发展趋势,从而实现动态增加该土地利用类型的数量。例如,未来规划需要更多的耕地,而上一次迭代中耕地的配置减少,自适应惯性系数将会增加,以保留更多的耕地,并促进其他土地利用类型向耕地转化。自适应惯性系数参与整个迭代过程计算,属于FLUS模型的灵魂,不需要任何设置,模型自动计算自适应惯性系数。
综合上述的适宜性概率、邻域影响因子、转换成本以及自适应惯性系数,即可得到总体转换概率。

图 总体概率


第三步轮盘赌预测
在得到总体转换概率以及目标后,如何推测各土地利用类型的分布呢?很多方法都是将总体概率最高的用地类型优先分配给各像元,但是这种方法仅考虑占主导的土地利用类型,忽略了其他非优势土地利用类型的分配机会。在FLUS模型中,采用了轮盘竞争机制来确定用地类型。由轮盘所占面积代表分配概率,再随机为像元分配用地类型,对于每个像元而言,总体概率高的用地类型被分配的可能性更大,但是较低概率的用地类型仍有机会被分配,该机制的随机特征性使模型能够更好地反映用地模拟的动态性与不确定性。

图 轮盘赌原理

结合上面的所有内容,FLUS模型流程大致如下:

图 flus模型流程

03
精度验证
FLUS模型以及模型中的参数是否能够准确模拟未来的土地利用情景呢?这就需要精度验证,用于衡量模型的准确程度及可靠性。FLUS模型选择使用kappa系数及FoM指标衡量其模型精度。
Kappa系数常用于衡量两个变量的一致性情况,其实现原理可以参考《分类模型评估神器-混淆矩阵》(今日第三篇) 这篇文章, Kappa指数的计算结果为-1~1,通常在0—1之间,且 Kappa值越大表示两个对比变量一致性越好。一般来说,当Kappa值大于0.75时,表示模拟结果与真实值差距较小,模拟精度较好,通常认为模型可用;当Kappa值小于 0.75时,表示模拟结果与真实值的差距较大,模拟精度较差,通常认为模型未达到可应用要求。
FoM指标的计算公式为:

式中:a是实际为变化而预测为不变的误差数量;b是实际与预测均为变化的正确数量;c是实际变化与预测变化不一致的误差数量;d是实际为不变而预测为变化的误差数量。FoM指标范围从0-1,其值越接近1表示模拟精度越高,但具体的阈值并没有固定标准,很多情况下这个指标结果都不会超过0.5。
04
FLUS使用流程
假设我们已经有2010年和2020年的土地利用现状数据以及对应驱动因子,要预测2030年的土地利用情景。可以先用2010年土地利用现状数据预测2020年的土地利用情景;再使用精度验证的方法,比较2020年的土地利用情景和2020年的土地利用现状数据,如果精度可以满足,说明当前使用的FLUS模型以及参数设置能够满足预测的要求,再根据2020年土地利用现状数据预测2030年的土地利用情景,其结果的可信度较高。

以上就是FLUS的基本原理以及使用的流程,下一节我们介绍在GeoScene Pro中如何(见:今日第二篇文章)


GISer last
GISer last 公众号 主要以分享互联网数据资源为主。也分享过GIS、FME等技术教程方法。我个人对于大数据资源、可视化制作、地图制图等方面有很大兴趣,也会分享个人的一些应用和教程。
 最新文章