用 CatBoost 和小波分解改进京津冀地区卫星高分辨率PM2.5估算

文摘   2024-12-26 23:27   山东  

在《Atmospheric Environment》期刊上发表的 “A CatBoost approach with wavelet decomposition to improve satellite-derived high-resolution  estimates in Beijing-Tianjin-Hebei” 一文中,福州大学的于丁、陈佐旗、卢文芳*、王小芹等研究者提出了一种创新方法。该方法利用 CatBoost 算法结合小波分解技术,对京津冀地区的高分辨率进行估算,为该领域的研究带来了新的思路和方法。

研究背景


随着空气污染对人类生活质量影响的日益凸显,作为主要空气污染物,其数据的准确性和高分辨率对于污染防控至关重要。京津冀地区作为我国污染较为严重的区域,迫切需要精准的数据来支持决策制定。然而,当前获取高分辨率数据面临诸多挑战,如地面监测站分布不均、卫星遥感数据受云层和降雨影响等。在此背景下,本研究旨在利用先进技术提高京津冀地区估算的精度。

CatBoost 算法简介


CatBoost 是一种基于树提升的梯度提升决策树框架。它通过独特的顺序提升方式替代传统梯度估计方法,有效降低了梯度偏差和预测偏移,显著提高了模型的准确性和泛化能力。尤其适用于处理具有众多输入特征和噪声数据的回归问题,这使其在本研究的 AOD 重建和估算中发挥了重要作用。在本研究中,研究人员运用贝叶斯优化算法对 CatBoost 的超参数进行微调,以确保模型达到最佳性能。

研究方法


  1. 数据来源

  • 高程数据:采用航天飞机雷达地形(SRTM)数据,该数据具有实用性强、免费获取的优点,经重采样得到 2015 年 1 公里网格的高程数据。

  • 气象数据:运用欧洲中期天气预报中心第五代再分析陆地(ERA5 - Land)2015 - 2019 年气象再分析数据,经立方插值处理后用于分析。

  • AOD 数据:使用 MODIS 基于多角度大气校正(MAIAC)算法的 AOD 产品,并以地基气溶胶机器人网络(AERONET)观测数据进行验证。

  • 地面测量数据:收集 2015 - 2019 年京津冀地区 155 个站点的测量数据,并进行严格筛选和处理。

  • 人口数据:获取世界人口(WorldPop)2015 - 2019 年 1 公里网格的年度人口分布数据。

  • 研究步骤

    • AOD 重建:以气象变量、一年中的第几天和高程为自变量,利用 CatBoost 模型对缺失的 AOD 数据进行重建,确保重建后 AOD 值为正。

    • 估算:采用两阶段法,第二阶段以无间隙 AOD、气象变量、天数和高程为输入,考虑气象数据滞后效应并进行小波分解,以优化估算结果。

    研究结果


    1. AOD 重建成果

    • 2015 - 2019 年 AOD 重建性能稳定,达 0.80 - 0.82,RMSE 约 0.15 - 0.17。重建后的 AOD 与 AERONET AOD 的为 0.52,优于同类研究,且合并数据集准确性较高,可用于后续估算。重建后 AOD 覆盖率显著提升,年平均 AOD 呈下降趋势,分布具有区域差异,季节性变化明显,夏季最高。


  • 估算效果

    • 对比不同实验,添加滞后气象因素和小波分解均有助于提高估算精度,其中 Case (5) 表现最佳,,RMSE = 。2015 - 2019 年年平均值逐年下降,季节性分布与 AOD 相似且各季节均值也下降,仅 2019 年冬季东南部仍较高。


  • 暴露分析结论

    • 2015 - 2019 年京津冀地区人口增加,但和人口加权暴露强度逐年下降。按区域分析,北部空气质量最优,东部降低显著,南部和暴露强度最高,北京人口密集,和暴露强度下降明显。

    研究结论


    本研究运用 CatBoost 算法结合小波分解技术,成功提高了京津冀地区卫星高分辨率估算的准确性。通过重建 AOD 数据,填补了数据空白,为深入了解该地区空气污染状况提供了关键支持。研究表明,京津冀地区浓度下降主要受人为因素影响,如污染防控政策,自然因素也有一定作用。未来研究可进一步优化方法,拓展研究范围,深入探究时空变化规律。本研究为大气环境管理和决策提供了重要的数据依据和科学参考。


    遥感前沿跟踪
    解读最新发表的国内外有价值的研究成果,分享有价值的遥感产品数据。将成为你作为遥感等行业专家获取最前沿信息的得力工具。接受读者投稿:chenglei_hou
     最新文章