科研进展 | SD: 2003—2022年中国高精度全天候逐日气温数据集重建

学术   2024-11-24 18:00   云南  

近日,大气环境遥感团队在《Nature》旗下的《Scientific Data》期刊上发表了一项合作研究,扩展了四维时空-深度森林模型,采用多源静态和动态参数,通过统一的方法,首次生成了自2003年以来覆盖中国的1公里无缝逐日最高温(Tmax)、最低温(Tmin)和平均温度(Tmean)数据集。该数据集填补了气象观测站稀疏地区温度数据的空白,对于理解气候变化,尤其是全球气候变暖及极端温度事件对环境与健康的影响,提供了至关重要的数据支持点击文末“阅读原文”,了解更多详细内容


研究背景

在全球变暖背景下,高分辨率的地表空气温度(Ta)数据集变得越来越重要。高精度、高时空分辨率和长期连续的温度数据集,尤其是那些捕捉极端温度的数据,对理解小尺度气候变化至关重要,例如城市热岛效应和山地小气候;识别季节性温度特征和异常天气事件;提高建筑物能源效率;预测和控制疾病;以及改善人类健康研究等。尽管广泛分布的气象站能够准确观测、捕捉并记录站点周围Ta的时空变化,但它们无法全面详细地描绘整个区域内Ta的时空分布和变化模式。同时,现有的气温数据集主要服务于大规模气候评估,时空分辨率相对较低,且在估计极端温度时的精度仍有提升空间。


数据与方法

本研究应用了先前开发的一种四维-时空深度森林(4D-STDF)的模型,该模型选择覆盖中国2003年以来2461个站点的地面高密度观测网络提供的观测数据作为真值,整合了12个多源因素,包括静态和动态参数(如1公里逐日短波辐射和地表温度等卫星遥感产品),及六个精细化的时空因素,以生成三个高精准的空气温度数据集:每日最高温度(Tmax)、最低温度(Tmin)和平均温度(Tmean),时间范围覆盖2003年至2022年,空间分辨率为1公里。基于4D-STDF模型和多源数据重建Tmax、Tmin和Tmean数据集的工作流程如图1所示。该方法包括三个主要步骤:首先,我们对多源数据进行预处理,执行时空匹配并计算时空因子。其次,使用4D-STDF模型对日Tmax、Tmin和Tmean进行年度训练和调整。最后,通过2003年至2022年间的10折交叉验证来评估模型的性能。

图1.本文研究技术路线图



研究结果

精度评估与数据分析

图2展示了中国所有观测站在所有研究年份的日、月、年尺度的Tmax、Tmin和Tmean估计值的基于样本的10折交叉验证结果。总体上,估计结果表现出较高的精度,大多数样本均匀分布在1:1线附近,与地面观测的Tmax、Tmin和Tmean高度一致。总体的日估计RMSE值分别为1.49 °C、1.53 °C和1.18 °C;月估计RMSE值分别为1.38 °C、1.65 °C和0.52 °C;年估计RMSE值分别为1.28 °C、1.83 °C和0.41 °C。补充表S1还表明模型在估计不同年份日Tmax、Tmin和Tmean方面表现出强劲的性能,R²均大于0.98。其中日Tmean的精度最高,MAE范围为0.81 °C至0.99 °C,RMSE范围为1.13 °C至1.27 °C。Tmax和Tmin的精度相当,MAE范围均为1.03 °C至1.12 °C,Tmax的RMSE范围为1.43 °C至1.57 °C,Tmin的RMSE范围为1.46 °C至1.57 °C。同时,基于站点的10折交叉验证结果展示了模型的总体R²值大于0.98,日估计的RMSE值分别为1.61 °C、1.70 °C和1.32 °C,与基于样本的10折交叉验证结果非常接近,这表明该模型在全国范围内无地面测量区域具有良好的预测能力。这些结果表明,本文研究预测数据集质量良好,适合用于精细尺度特别是城市地区研究。

图2.中国2003年至2022年逐日平均温度、最高温度和最低温度估算值的基于样本的10折交叉验证结果


我们进一步评估了空气温度(Ta)估计在每个地面观测站点精度,如图3所示。在不同地区应用的4D-STDF模型显示出不同的精度,东部地区表现出较高的精度(R² > 0.95,MAE和RMSE < 1.5 °C),而西部地区精度相对较低(R² < 0.9,MAE和RMSE > 1.5 °C)。Tmean估计在整个空间范围内变化较小,东部大部分站点的RMSE小于1 °C。然而,西部偶尔出现精度较低的情况,RMSE超过2°C;Tmax估计在东南部地区精度较高,RMSE主要低于1.5 °C,部分孤立区域的估计误差甚至低于1 °C。相比之下,西部和北部地区误差较高,RMSE通常超过2 °C,特别是在干旱的西北地区,部分站点的RMSE超过2.5 °C;Tmin的最高精度出现在中国中部,误差通常低于1 °C,但较高的误差集中在东北和西北的寒冷区域,RMSE通常超过2.5 °C。这些Ta的空间变化为我们数据集的可靠性提供了有力证据。

图3.中国2003年至2022年间各站点的日Tmax、Tmin和Tmean精度评估空间分布

      为了展示数据集的潜力,我们分析了2003至2022年间中国空气温度的年度空间变化(图4)。在高海拔地区,如青藏高原,Tmax值最低,温度约为15°C。相反,低纬度地区通常经历较高的Tmax值,最大Tmax出现在高纬度的干旱和半干旱地区,平均值达到约41.1°C。Tmin值在高纬度地区较低,特别是在北部地区和高海拔地区,最低可达−31.2°C。随着纬度降低,Tmin值趋于增高,最高可达0.5°C。Tmean值在高纬度和高海拔地区最低,随着纬度的减少逐渐上升,最高达到18.9°C。


图4.中国2003年至2022年间日平均温度、最高温度和最低温度的平均空间分布


研究结论

我们研究通过将空间和时间坐标进行详细分解,更好地捕捉和考虑其对气温估计模型的影响,通过结合18个因素,使用深度森林模型,并基于时空位置选择最优参数,我们实现了空气温度数据集(特别是极端温度)的高精准反演,使得这些数据集及其估计方法成为现有温度估计产品的重要补充。


数据共享

本文开发的中国2003-2022年1公里无缝隙空气温度数据已通过Zenodo平台向全球用户免费开放获取,未来会持续更新,欢迎下载使用:
https://doi.org/10.5281/zenodo.10947353

研究团队

中国科学院地理科学与资源研究所博士生王敏和马里兰大学韦晶博士为本文共同第一作者,北京市气象局栾庆祖研究员为本文通讯作者,合作者还包括中科院地理科学与资源研究所徐新良研究员等。该研究得到了风云应用先行项目和风云三号地面应用系统项目的资助。



长按二维码关注我们

走天涯徐小洋地理数据科学
一个爱生活的地理土博,分享GIS、遥感、空间分析、R语言、景观生态等地理数据科学实操教程、经典文献、数据资源
 最新文章