DOI:https://doi.org/10.1038/s41597-024-03980-z
主要内容:
高精度、高时空分辨率的连续气温(Ta)数据集对于人类健康、疾病预测和能源管理至关重要。现有数据集考虑了海拔、纬度和地表温度等因素,但对气象和时空因素的考虑不足,影响了准确性。此外,目前还没有包含使用统一方法生成的每日最高温度(T max)、最低温度(T min)和平均温度(T mean)的高分辨率数据集。在这里,我们引入了四维时空深度森林(4D-STDF)模型,该模型整合了 12 个多源因子(涵盖静态和动态参数)以及 6 个细化时空因子来生成 Ta 数据集。该方法生成了三个高精度的 1 公里空间分辨率的 Ta 数据集,覆盖中国大陆 2003 年至 2022 年。这些数据集采用 GGS84 投影的 GeoTIFF 格式,包括每日 T max、T min和 T mean。估计值的整体 RMSE 分别为 1.49 °C、1.53 °C 和 1.18 °C。4D-STDF 模型也可以应用于其他气象站点稀疏的地区。
主要图表:
图1.构建和验证每日 Ta(T max、T min和 T mean )数据集的工作流程。图3.散点图展示了2003 年至 2022 年期间中国大陆地面站基于样本的 10-CV 每日、每月和每年 T max、 T min和 T mean估计的综合结果。图4.2003 年至 2022 年中国大陆各站点T max、T min和 T mean的 R²、MAE 和 RMSE 的空间分布图。图5.2003 年至 2022 年中国大陆地区Tmax(红线)、Tmin(蓝线)和 Tmean(绿线)的每日RMSE 。图6.2003—2022年中国大陆平均Ta估算空间格局。