基于Copula函数的千米尺度综合干旱指数构建与应用——以重庆市为例
杨辰飞1, 吴田军2, 王长鹏1, 杨丽娟1, 骆剑承3,4, 张新3,4
干旱是影响农业生产最大的自然灾害之一,开发综合干旱指数对于评估干旱具有现实意义。该文耦合XGBoost算法降尺度后的土壤水分和降水Z指数数据,在空间上以重庆市行政区县边界分区,时间上以旬为单位分段,基于Copula函数构建千米尺度网格化的综合干旱指数(meteorology-agriculture composite standardized dranght index,CSDIM-A),评估干旱的时空特征。结果表明,降尺度提高了遥感产品的空间连续性,为后续构建千米尺度的CSDIM-A提供支持; 广义极值分布和t位置尺度分布分别适用于拟合重庆市大多数区县土壤水分和降水变量数据分布,Frank-copula函数适用于拟合旬尺度下二元变量的联合分布; 基于土壤墒情数据验证构建的CSDIM-A比降水Z指数能更好地反映干旱信息,基于各区县得到CSDIM-A的空间分布与实际旱情资料相符,说明所构建的CSDIM-A可为干旱评估提供参考。
0 引言
干旱是世界范围内频发的自然灾害,对人类生活和社会经济发展等方面影响重大。2009—2010年我国西南5省市极端干旱持续5—6个月,部分地区长达8个月,最大影响面积为576.82万km2[1],农作物受灾面积占全国总受旱面积的50%以上,此类严重的干旱事件对农业经济造成巨大损失。2022年,重庆等地遭遇60 a来最严重的旱灾,持续高温少雨致使31个区县累计受灾人口60余万。因此,深入研究干旱时空分布信息对于干旱的监测和预警、减轻干旱对农业生产造成的损失具有重要的现实意义。
干旱可被分为气象干旱、农业干旱、水文干旱和社会经济干旱[2],其中农业干旱通常表现为土壤水分不足,气象干旱是由于在一定时间内缺乏降水,而水文干旱通常由气象干旱引发,是气候和流域特征共同控制的结果,社会经济干旱则是由自然系统与人类社会经济系统中水资源供需不平衡导致。对于干旱的判别,最常用的干旱指数有: 标准化降水指数(standardized precipitation index,SPI)、降水距平百分率(precipitation anomaly,PA)、帕默尔干旱指数(Palmer drought severity index,PDSI)和综合气象干旱指数(composite index,CI)等,这类单一的干旱指数各有侧重,用于干旱评估时有较大的局限性,无法完全表征不同类型的干旱,通过组合代表不同干旱类别的指数,构建综合干旱指数能够提高干旱监测的准确性。
目前最为常用的组合方法有: 权重法、机器学习法和多变量联合法。Jiménez-Donaire等综合了降雨量、土壤水分和植被动态,提出了适用于西班牙南部地区的综合干旱指标,并基于SPI、土壤水分异常指数(soil moisture anomaly index,SMAI)、归一化植被指数(normalized difference vegetation index,NDVI)设定联合干旱指标(combined drought indicator,CDI)的判别标准; 朱悦璐等[5]通过权重法综合4种单变量干旱指数,构建可描述气象干旱与水文干旱的综合干旱指数(meteorological and hydrological drought index,MHDI); 玉院和结合MODIS,TRMM和数字高程模型(digital elevation model,DEM)等遥感数据,利用主成分分析法和层次分析法构建云南省综合干旱监测模型; 刘高鸣等[7]综合植被状态及土壤水分等信息,基于标准化降水蒸散指数(standardized precipitation evapotranspiration index,SPEI)、植被状态指数(vegetation condition index,VCI)、温度状态指数(temperature condition index,TCI)、温度植被状态指数(temperature vegetation dryness index,TVDI)建立决策树模型并应用于河南省干旱监测。然而,权重法和层次分析法等在赋权时依赖于经验判断,具有很强的主观性,主成分分析法在降维时无法保留完整的信息,进而影响干旱评估的准确性,机器学习方法基于对大样本的模糊挖掘,虽然能高效处理数据,但得到的模型仅适用于特定区域干旱研究,模型参数的设置非常关键[8]。
Copula函数连接了多个具有不同边缘分布的变量,保留各个变量的完整信息,在干旱监测方面应用广泛。Xu等结合降水量、潜在蒸散量和土壤湿度变量,基于Copula函数对降水量与潜在蒸散量的差和土壤湿度进行联合建模,开发了干旱指数(standard precipitation potential evapotranspiration and root-zone soil moisture index,SPESMI)来评估河南省干旱; 李军等[10]利用Copula函数基于站点的降雨、蒸散发、径流和土壤水等要素,构建3个月时间尺度的新型综合干旱指数(comprehensive standardized drought index,CSDI),该指数仅能表征所选站点的干旱特征,无法满足区域上的干旱监测,而且3个月尺度的监测在时间分辨率上过于粗糙,对于长历时干旱有较好的表征能力,但是无法实现对短历时或具体某次干旱事件的监测。
此外,基于中等空间分辨率遥感数据得到的干旱监测指数被广泛研究,但是很多综合干旱指数所用数据类型存在时空尺度不匹配以及时空分辨率低的问题,杜瑞麒等利用25 km空间分辨率的降水、感热通量和潜热通量数据建立标准化波文比指数,结合标准化降水指数构建综合干旱指数; Sánchez等利用25 km空间分辨率的SMOS土壤水分数据计算VCI,并利用500 m空间分辨率的NDVI和地表温度计算TCI和土壤水分状态指数(soilmoisture condition index,SMCI),最终经耦合得到土壤水分干旱指数研究伊比利亚岛的干旱状况。
基于此,本文考虑土壤水分和降水Z指数作为干旱的特征变量,分别描述农业干旱和气象干旱,将遥感产品降尺度得到千米尺度的高空间分辨率土壤水分和降水产品,通过Copula函数联合土壤水分和降水Z指数,在空间上以区县边界分区,时间上以旬为单位分段,构建一种同时表征气象-农业干旱的综合干旱指数(meteorology-agriculture composite standardized drought index,CSDIM-A)。为了探究其适用性,本文选择重庆市作为研究区,分别计算重庆市各区县每旬、1 km空间分辨率的CSDIM-A,评估不同区域干旱的时空特征,为重庆地区抗旱减灾提供参考。
1 研究区概况及数据源
1.1 研究区概况
本文选取重庆市为研究区,如图1所示,位于N28°10'~32°13',E105°11'~110°11'之间。该区为亚热带季风性湿润气候,年平均降水量为1 000~1 350 mm,多集中在5—9月,气候类型显著,气象灾害频繁。重庆市应急管理局和重庆市气象局等数据显示,2022年夏季,重庆共出现4次高温,7月以来,重庆年平均降水量较历年减少约五成,受高温少雨影响,西部、中部和东北部陆续出现轻度气象干旱,8月以来大部分地区出现中度至重度气象干旱,中部和东北部等局部地区达到重旱至特旱,农作物受灾面积超3.67万hm2。基于遥感数据构建干旱监测指数有重要的研究价值,而且结合多个干旱监测指数能提高单变量干旱监测指数的误差[11]。因此,耦合表征农业干旱和气象干旱的高空间分辨率的土壤水分和降水Z指数得到千米尺度的CSDIM-A对研究区干旱监测和预警有迫切需求。
1.2 实验数据及其处理
本文所用的数据包括土壤水分、降水Z指数以及土壤墒情数据。其中,微波遥感土壤水分产品来自于美国NASA网站的SMAP数据(
为了将多源数据进行时空匹配,同时解决现有的土壤水分产品和降水Z指数数据空间分辨率低、不足以进行局部或精细尺度研究的问题,本文利用XGBoost算法对数据进行降尺度处理,统一空间分辨率,分别建立SMAP微波遥感土壤水分产品和降水Z指数与降尺度因子之间的非线性关系模型,得出1 km尺度的土壤水分和降水Z指数数据。其次是统一时间分辨率,将所收集的土壤水分与降水Z指数处理成逐旬数据,时间范围为2020年1月—2022年7月,最终,研究区范围生成243 000个栅格点数据。
2 研究方法
分别收集表征农业干旱和气象干旱的土壤水分数据和降水Z指数数据,利用XGBoost算法对源尺度遥感产品进行降尺度,将得到的1 km空间分辨率的土壤水分数据和降水Z指数通过Copula函数联合,在空间上以行政区县边界分区,时间上以旬为单位分段,构建一种同时表征气象-农业干旱的综合干旱指数CSDIM-A。以石柱县干旱事件为例进行实例分析,并计算重庆市各区县的CSDIM-A,评估不同区域干旱的时空特征。研究技术路线如图2所示。
2.1 降尺度
构建降尺度模型的关键是找到合适的解释变量,本文在降尺度因子的选择上结合了山地区土壤水分和降水的分异规律,克服了原始粗空间尺度上遥感产品空间分辨率低的问题,能够实现区域尺度上干旱监测的需求。本文分别对重庆地区9 km尺度土壤水分数据和5 km尺度降水Z指数数据进行降尺度处理,具体包括以下步骤:
1)获取重庆地区土壤水分和降水Z指数数据,纳入地形、土壤等辅助数据作为特征。辅助特征适用于复杂山地区,包括土地利用/覆盖类型、坡度、海拔等。由于土壤质地影响土壤的持水能力,对土壤水分分布产生显著影响,含砂量较低的土壤更有可能保持湿润状态,选择土壤类数据如土壤黏土量、土壤砂土量和土壤有机碳含量等,将各辅助数据重采样至源尺度,最终本文形成解释变量共计58个,将辅助数据增加至XGBoost算法的特征集中,分别建立土壤水分和降水Z指数和58个特征之间的非线性关系模型。
2)在源尺度上,利用XGBoost算法进行训练学习,解释变量为各个特征的数据,特征共58个,训练样本3 000个,响应变量为遥感数据转化的像元值,建立特征和遥感数据之间的非线性关系模型,最终可得到源尺度上的残差。
3)在1 km尺度上聚合残差。将步骤2)得到的源尺度上遥感数据的残差进行克里金插值重采样至1 km尺度,得出1 km尺度上的残差数据。
4)根据降尺度的原理,遥感数据与其解释变量之间的函数关系不随空间尺度的变化而变化,将各辅助数据重采样至1 km尺度,输入XGBoost算法模型中,预测1 km尺度上的土壤水分或降水Z指数,得到未经残差校正的值,然后将预测值加步骤3)得到的残差项,最终得到经过残差校正的空间分辨率为1 km尺度的土壤水分数据或降水Z指数,实现遥感产品数据的降尺度处理。
2.2 边缘分布函数构建
选取常见的6种单变量分布函数(广义极值分布(generalized extreme value distribution,GEV)、对数逻辑分布(log-logistic)、对数正态分布(log-normal)、t位置尺度分布(t location-scale distribution,TLS)、伽马分布(Gamma)、逻辑分布(logistic))拟合土壤水分特征变量的边缘分布,3种单变量分布函数(GEV,TLS和logistic)拟合降水Z指数特征变量的边缘分布,并利用Kolmogorov-Smirnov(K-S)检验法检验拟合优度,进而选出最优的边缘分布函数。
2.3 基于Copula函数的综合干旱指数建立
Copula函数用于连接具有不同边缘分布的变量,构造出联合分布函数。由于Copula函数本身结构的特殊性,在模型转化时能够保持完整的有效信息,被广泛应用到农业干旱风险建模上。二维Copula函数如表1所示。
表1 二维Copula函数形式
3 结果与分析
3.1 空间降尺度结果
分别建立土壤水分和降水Z指数数据和58个特征之间的非线性关系模型,利用XGBoost算法分别对9 km微波遥感土壤水分产品和5 km降水Z指数产品降尺度到1 km,以2022年1月1日为例,图4显示了土壤水分和降水Z指数数据降尺度前后的空间分布对比。
从图4中可以看出,9 km和5 km的空间分辨率相对粗糙,无法准确反映土壤水分和降水的空间分布变化,而降尺度后的结果更能详细地看出网格尺度土壤水分和降水的变化情况。另外,降尺度后的空间分布趋势与原始尺度相似,1 km空间分辨率的降尺度结果更好地提高产品的精细度。对于常规的网格尺度的土壤水分和降水产品无法精细地表达地面细节,通过降尺度能提高遥感产品的空间连续性,利用降尺度后的数据在空间上表达的信息更丰富为后续构建千米尺度的综合干旱指数,以及实现精细的干旱监测和评估提供支持。
3.2 干旱特征变量边缘分布
从空间上来看,由于气候因素、下垫面类型等异质性的影响,干旱特征变量如土壤水分和降水等在重庆市不同区域上存在明显差异。土壤水分连接着地表水循环和能量循环,影响着农业干旱过程,由于地理位置不同、土层深度差异,植被恢复程度不一,土壤水分含量在空间分布表现出明显的异质性。重庆各地区降水分布差异较大,渝东南较多,中西部较少。根据地理学三定律,区域的地理配置越相似,目标变量在区域的值越相似,同时,孕灾环境脆弱性与干旱区地理地貌等自然环境有关,因此,在空间上,将同一个区或县划分为一个整体。从时间上来看,重庆市干旱的发生频次与月份有关,总体上,冬季干旱频率最低,而夏旱和伏旱频率最高,高温少雨导致极端干旱频发。不同时间尺度在干旱识别上差异较大,目前大多数基于长时间尺度的干旱指数在检验旱情方面存在灵敏度低、响应延迟等问题。因此,构造短时间尺度的干旱指数能更好地识别干旱强度、捕捉干旱特征,本文在时间尺度选择以旬为单位。
基于此,本文根据重庆市行政区县边界将重庆区域划分为38个子区域,利用2020—2022年1 km空间分辨率的土壤水分和降水Z指数数据集,以旬为单位分别构建适用于不同区域的边缘分布函数和CSDIM-A,揭示不同区域干旱的时空特征,检验耦合的综合干旱指数。分别通过上述6种单变量分布函数拟合土壤水分特征变量的边缘分布,3种单变量分布函数拟合降水Z指数序列,并利用K-S检验法的p值评估拟合效果,选择出最佳的边缘分布函数,干旱特征变量边缘分布的K-S检验的p值如图5—6所示。
对于土壤水分变量,广义极值分布更适合重庆市大多数地区,对于降水变量,t位置尺度分布的拟合效果较好。本文得到的p值是在1 km空间分辨率下,每个区县以旬为单位K-S检验的p值,p值可能随时空分辨率的变化而改变。
3.3 干旱特征变量二维联合分布
通过计算不同区县上述5种多变量联合分布的Copula函数和经验Copula函数之间的平方欧式距离进行联合分布函数的拟合优度检验,最终得到Copula函数对于重庆市各区县适用性的结果(图7)。可以看出,Gaussian-copula函数、Gumbel-copula函数和Frank-copula函数模型都能较好地模拟土壤水分和降水的联合分布,而对于重庆大多数区县,多变量联合分布的最优模型为Frank-copula函数。
3.4 CSDIM-A的应用效果分析
3.4.1 基于土壤墒情资料的验证
土壤墒情是指土壤的干湿情况,直接关系到作物在各个生长期的生长状况,通过墒情监测能够判断作物是否缺水进而识别是否干旱,因此,本文基于土壤墒情实测数据对CSDIM-A进行验证。收集了重庆地区30个站点土壤墒情数据,数据项包括10 cm和30 cm土层深的2021年3月9日—2022年3月9日土壤墒情日尺度数据,共7 544组记录,整理得到旬尺度土壤墒情数据用于验证构建的CSDIM-A。通过提取墒情站点对应的CSDIM-A和降水Z指数的值,分别与10 cm和30 cm土壤墒情数据计算相关系数,得到的结果如图8所示。
从图8可得到CSDIM-A和降水Z指数与10 cm和30 cm土壤墒情都存在一定的相关性,但是降水Z指数在1月、6月、8月、12月与10 cm和30 cm土壤墒情的相关性未通过0.05的显著性检验,而CSDIM-A与土壤墒情的相关性都通过了0.05的显著性检验; 从相关系数来看,CSDIM-A在6月、7月和11月与10 cm土层土壤墒情的相关性最高,在4—8月与30 cm土层土壤墒情的相关性最高,2月和3月的相关性最差; 从土壤墒情的土层深度来看,土层越深,CSDIM-A与土壤墒情的相关性越弱。
3.4.2 基于干旱实例的验证
重庆地区在2022年夏季遭遇特大干旱,受地理环境影响,石柱县是干旱灾害较为严重的区县之一。本文以重庆市石柱县2022年7月中旬干旱为例,计算CSDIM-A检验其干旱监测能力。如图9显示了土壤水分变量的累积概率的拟合图,可以看出用广义极值分布函数的拟合曲线与土壤水分数据较吻合。
通过计算5种Copula函数和经验Copula函数之间的平方欧式距离检验联合分布函数的拟合优度。其中,Frank-copula函数和经验Copula函数之间的平方欧式距离为0.014 3,说明Frank-copula函数的拟合优度最佳,因此,选用Frank-copula函数作为土壤水分和降水的联合分布函数,石柱县二元Frank-copula分布函数图如图10所示。
根据联合分布函数计算得到2022年7月中旬石柱县CSDIM-A指数,图11(a)—(c)分别展示了石柱县土壤水分、降水Z指数和CSDIM-A的空间分布。
从图11可以看出,在旬尺度下CSDIM-A的走势和变化规律与降水Z指数和土壤水分有较好的一致性。通常情况下,干旱的发生是由降水持续不足引起,进而导致土壤水分不足,阻碍作物生长,产生农业干旱。降水Z指数对于捕捉气象干旱比较敏感,但是干旱的产生机制十分复杂,农业干旱对气象干旱的响应存在延迟,基于土壤水分和降水构建的CSDIM-A结合了气象干旱和农业干旱信息,在描述干旱的发生上优于单变量的干旱指数,为识别干旱提供了一种新的度量。
3.5 重庆市干旱时空特征分析
利用2022年7月中旬重庆市各区县土壤水分和降水相关数据,分别构建最适合的二元联合Copula函数,根据联合分布函数分别计算旬尺度下重庆市各区县CSDIM-A,再将各区县的结果进行栅格合并。图12(a)—(c)分别展示了重庆市土壤水分、降水Z指数、CSDIM-A的空间分布,可以看出CSDIM-A监测重庆地区干旱具有可靠性。
通过对比图12发现,CSDIM-A结果显示重庆市2022年7月东部、东北部以及西部地区干旱严重,干旱空间分布与降水Z指数相似,表明CSDIM-A捕捉气象干旱的能力较强,而土壤水分空间分布对于西部、东部干旱的识别不敏感,但对于西部干旱较为敏感。此外,CSDIM-A也能识别降水Z指数未识别到的西部的干旱。
据2022年7月重庆旱情资料显示,重庆市东北部奉节县、巫溪县、巫山县、城口县以及中部涪陵区等5个区县重度缺墒,西部永川区、大足区、铜梁区等中度缺墒,与本文得到的CSDIM-A的空间分布情况较为一致,证明本文所构建的CSDIM-A适用于评估重庆市的旱情。
4 结论与讨论
干旱是最主要的自然灾害之一,研究融合多源信息的CSDIM-A,有助于监测和评估区域干旱。本文以土壤水分和降水分别作为表征农业干旱和气象干旱的指标,收集9 km空间分辨率的SMAP土壤水分数据和CHIRPS数据集的5 km空间分辨率的降水Z指数数据,通过XGBoost算法分别降尺度到1 km; 同时,将所收集的土壤水分数据与降水Z指数数据处理为逐旬数据,对多源遥感数据进行时空匹配。构建CSDIM-A时,在空间上以重庆市行政区县边界分区,时间上以旬为单位分段,基于Copula函数的概念,分别计算重庆市各区县旬尺度的CSDIM-A,采用重庆市石柱县相关数据进行实例验证,并基于该指数分析2022年7月中旬重庆市综合干旱的变化特征。得出以下结论:
1)根据遥感数据降尺度前后的空间分布对比,发现原始尺度的低空间分辨率数据无法准确反映土壤水分和降水的空间分布变化,降尺度后得到1 km空间分辨率的结果,提高了遥感产品的精细度。
2)通过K-S检验的p值发现,广义极值分布适用于拟合重庆市大多数区县土壤水分变量,t位置尺度分布拟合降水变量效果较好。对于重庆市各区县旬尺度下干旱特征变量的二元联合分布,Frank-copula函数拟合优度最高。
3)分别利用土壤墒情资料和干旱实例验证本文构建的CSDIM-A的应用效果,根据土壤墒情数据验证得到,CSDIM-A和降水Z指数与10 cm和30 cm土壤墒情都存在一定的相关性,CSDIM-A在6月、7月、11月与10 cm土层土壤墒情的相关性最高,在4—8月与30 cm土层土壤墒情的相关性最高,在一定程度上更能反映干旱信息。利用重庆市石柱县相关数据进行实例验证得出,在旬尺度下CSDIM-A的走势和变化规律与降水Z指数和土壤水分有较好的一致性,同时,CSDIM-A得出干旱的空间分布与降水Z指数相似,捕捉气象干旱的能力较强,也能结合土壤水分信息,识别降水Z指数未识别到的干旱。
4)基于各区县得到CSDIM-A分析2022年7月中旬重庆市各区县干旱特征,结果显示得到的干旱区域与实际旱情资料较吻合,说明本文所构建的CSDIM-A具有一定的合理性和可靠性。
CSDIM-A考虑了气象干旱和农业干旱的信息,旨在提供一种适用于不同区县不同月份的干旱指数,所开发的CSDIM-A与重庆市各区县干旱的实际情况较符合,证明了本文所构建的CSDIM-A对干旱的识别有较大潜力。
本文基于土壤水分和降水等遥感数据,弥补了气象站点和土壤水分观测站的数据可获得性的不足,构建了适合于重庆各区县的CSDIM-A,且兼具了表征农业和气象干旱的能力,可对现有干旱评估提供参考。但本文仍存在一些研究的局限性,在干旱指标的选择上,未考虑水文和社会经济因素,所得到的CSDIM-A对水文干旱不敏感,未来可尝试利用深度学习方法融合异质遥感数据。此外,在构建适用于不同区县的CSDIM-A时,对于空间上采用区县边界进行分区,后续将结合地形地貌等信息,考虑更弹性、合理的划分,同时寻找适用于不同地区的特征变量。在干旱监测验证方面,尚无统一的验证体系,许多学者通过已有干旱事件或者干旱指数与作物产量或受灾面积之间的关系来验证干旱指数的适用性。未来研究将考虑这些不足,以期构建出更合理的且适用于全球尺度的多变量综合干旱指数。
(原文有删减)
【作者简介】 杨辰飞(1998-),女,硕士研究生,研究方向为空间统计。
Email:
【基金资助】内蒙古自治区科技重大专项项目“现代牧区草地高效生产与家畜优化利用技术研发与示范”(2021ZD0045);国家自然科学基金项目“地块作物生长的光学与SAR遥感同步观测响应机制研究”(42071316);国家重点研发计划项目“地理空间智能核心技术与软件系统”(2021YFB3900905);第三次新疆综合科学考察项目“新疆遥感动态监测系统及时序信息反演”(2021xjkk1400);国家自然科学基金项目“贝叶斯低秩矩阵分解算法研究”(12001057);重庆市农业信息中心项目“农业产业数字化地图”(21C00346)
【引文文本】杨辰飞, 吴田军, 王长鹏, 杨丽娟, 骆剑承, 张新. 基于Copula函数的千米尺度综合干旱指数构建与应用——以重庆市为例[J]. 自然资源遥感, 2024, 36(3): 117-127.
标准地图 | 重庆市2024
重庆万州23.7暴雨触发滑坡情况分析,基于卫星和无人机图像
三峡库区(重庆段)水源涵养功能遥感监测及时空分布特征分析