北京师范大学硕士生一作在遥感顶刊(IF=11.1)发表高水平研究文章!

学术   2024-11-03 12:05   江苏  

近日,大气环境遥感团队在遥感领域顶级期刊RSE上发表了一项合作研究,开发了多维时空人工智能模型,通过考虑地面臭氧生成的关键光化学反应过程,首次估算了中国24小时1公里无缝隙地面臭氧浓度。研究详细探讨了地面臭氧水平的昼夜变化,发现其显著的昼夜波动幅度达到了均值水平的62%。同时,研究利用可解释人工智能XAI技术分析了地臭氧昼夜变化的驱动因素,并进一步评估了地臭氧污染对空气质量和植被毒性的影响等点击文末“阅读原文”,阅读研究原文


研究背景

臭氧O₃是大气中的一种重要痕量气体,主要分布在平流层,其中位于对流层下层,特别是近地表的臭氧会损害人类健康并抑制植物生长。中国作为全球人口最多且发展迅速的国家之一,一直面临严重的空气质量问题,特别是近年来地面臭氧污染显著加剧。因此,未来急需更有效的地臭氧控制措施。为应对地臭氧污染日益严重的问题,持续监测其质量浓度至关重要。卫星遥感主要提供臭氧总柱浓度数据,同时其垂直廓线反演的不确定性较大,导致地面臭氧估算面临严峻挑战。近年来,许多研究尝试利用机器学习ML获取地表臭氧浓度,取得了较好效果,但大多数先前研究主要集中在MDA8尺度,仅少数涉及小时尺度,且这些研究仅在白天(通常不到10小时)进行,未能提供全面的24小时覆盖。然而,24小时的臭氧数据对于计算空气质量指标如MDA8以及臭氧暴露植物毒性指数(例如AOT0和SUM06等)至关重要。此外,大多数前期研究反演结果受到云层的影响存在大量数据缺失,严重限制了其应用。因此,我们研究首次尝试利用大数据和人工智能在中国以1公里分辨率估算无缝隙的24小时地表O₃浓度。


数据与方法

考虑到缺少对流层臭氧卫星遥感产品,本研究选择影响臭氧生成光化学反应的核心气象和气态前体物等关键因子作为主要输入进行地面臭氧遥感反演,包括NASA GeoNEX逐小时短波辐射DSR数据,Himawari-8逐小时UVAUVB紫外辐射数据,GHA-LST全天候逐小时地表温度LST产品。由于缺少静止卫星气体产品,我们引入了TROPOMI对流层O3NO2HCHO柱浓度产品。此外,我们还引入了清华大学开发的中国逐日1千米人为排放清单,包括NOxVOCsCO。其它辅助变量包括边界层高度、湿度、降水、气压、风速和风向等其它气象条件,以及人口分布、高程和土地覆盖。我们共选择了19个和16个变量分别用于白天和夜间地面臭氧反演
在本研究中,我们选择了9个基于树的ML模型和6个深度学习DL模型,前者包括决策树及其八个衍生集成学习模型:包括随机森林RF、极端随机树ET、自适应提升树AdaBoost、梯度提升决策树GBDT、极端梯度提升树XGBoost、轻量级梯度提升机LightGBM和分类提升树CatBoost。DL模型包括多层感知器MLP、卷积神经网络CNN、长短时记忆网络LSTM、深度置信网络DBN、深度残差网络ResNet和下一代残差网络ResNeXt模型。为提高预测精度,我们在模型中引入了基于多维极坐标加权效应计算的时空因素,扩展了新的四维时空-人工智能模型,有效考虑了空气污染的空间差异、昼夜变化和季节循环。

图1.本文研究技术路线图



研究结果

最优模型选择

表1首先比较了15种AI模型在估算中国同一小时地表O₃浓度时的模型性能和效率。大多数基于树的ML模型具有较快的训练速度且内存消耗相对较少,其中AdaBoost模型表现最差。GDBT和DT模型在预测小时地表O₃方面表现相似,而其衍生的集成学习模型(如CatBoost、XGBoost、RF和LightGBM)准确度有所提高。ET模型整体精度仅次于DF模型,但训练速度比DF模型快约192倍,且使用的内存仅为其一半。在6种DL模型中,MLP模型表现最差,但其训练速度较快。DBN模型的准确性有所提高且内存占用极少,但耗时较长。ResNet模型通过引入残差结构来解决梯度消失或爆炸等问题,可以高效地提供结果;随着其模型结构和损失函数的不断优化,地表O₃估算的准确度稳步提升。然而训练速度和内存需求也随之增加。LSTM模型也并未表现出优越性,因为容易在训练数据上过拟合。有趣的是,多数DL模型在回归问题上表现不如且效率低于基于树的ML模型,这是因为深度学习主要用于处理更复杂的计算机视觉任务(如目标识别和检测),需要大量的数据样本。通过综合考虑模型的性能和效率,我们最终选择了ET模型作为四维时空-AI模型的核心模型来估算逐小时地表O₃浓度

表1.不同四维时空-人工智能模型整体精度和性能效率比较


24小时地面臭氧精度评估
图2展示了基于样本的四维时空-极端随机树模型在每小时地表O₃估算的整体准确性。模型的准确性因小时不同而变化:午夜0点O₃估算值与地面观测数据较为接近,随后整体精度较为稳定,直到早上7点,CV-R²保持在0.77-0.79,估计不确定性逐渐减小。模型表现在白天期间显著提高,CV-R²逐渐增加且斜率接近1,RMSE逐渐减少;下午5点时,模型性能达到峰值,CV-R²为0.91。随后模型性能逐渐下降,尽管如此,CV-R²一直保持在0.8以上。基于站点和区块的空间交叉验证结果也显示出相似的趋势,表明了模型在不同小时里没有观测站点的地方也具有较好的预测精度。总体而言,在全国尺度,该模型在全天各时段的地表O₃浓度小时估算中实现了较高的整体准确性,平均精度达到89%,在白天和夜间的表现均出色,整体精度分别为92%和82%。

图2.中国2019年每小时地面O3估计值的样本外十折交叉验证结果

地面臭氧昼夜变化及驱动因素分析

      图3展示了中国2019年卫星反演的24小时1公里无缝隙地表O₃浓度分布,地表O₃表现出强烈的日变化:早上8点,O₃浓度最低,随着日出后时间推移,浓度逐渐增加,北方地区O₃浓度上升速度快于南方,随后在中国中部和东部地区普遍呈现增长趋势,然后在大部分区域内继续显著上升,大多数超过100 μg/m³,下午3点达到峰值。此后,O₃污染高值区迅速缩小。南方O₃浓度下降速度快于北方,华东地区下降最快。白天大部分区域的地表O₃浓度超过80 μg/m³,华北平原和西北地区地表O₃浓度尤其高。相比之下,夜晚地表O₃浓度持续低于60 μg/m³,少数西部和中部地区除外。总体而言,白地表O₃浓度明显高于夜晚浓度,约为其1.4倍。这一差异主要归因于大气过程、排放和光化学反应的复杂相互作用,例如白天较高的氧化剂OX水平和夜间较低的边界层高度促进了NO滴定反应,从而消耗了夜间的O₃。类似的日变化在区域尺度上也可观察到,其中京津冀的昼夜变化更为显著。


图3.中国2019年卫星反演的每小时1公里地表O3浓度分布图,以及(a)白天(08:00-20:00 LT)和(b)夜间(20:00-08:00 LT)的平均图

      我们利用XAI-SHAP技术了解影响地表O₃日内变化的驱动因素(图4):上午的影响因素更加复杂,其中BLH、风速、太阳辐射和对流层TNO₂是最重要的4个影响因素。这是因为太阳辐射能量和近地表温度的增加促进了光化学反应过程;此外,BLH和风速所引起的间歇性垂直湍流运动促进了残余O₃层向地表移动,从而提高了地表O₃浓度。11点到下午4点,辐射、LST、RH和BLH持续为四个最重要的因素。因为增强的辐射和升高的温度显著刺激了原子氧和氧化剂的产生,增强了光化学反应。随着时间推移,太阳辐射的贡献逐渐减弱,而LST和RH的作用显著上升。由于持续的人类活动和交通排放,TNO₂仍然保持稳定较大的影响。傍晚随着太阳辐射的消失,温度成为最关键的变量,但其贡献从晚上7点的26%逐渐下降至次日早上7点的3%。此外RH整体呈下降趋势,而TNO₂的贡献则呈上升趋势,从6%增加至20%。可能是RH与O₃的干沉降密切相关,可以影响其去除,因为高RH水平可以通过水滴或气溶胶颗粒对O₃的吸附增强O₃的沉降速率。夜晚,其它气象条件(如风速)和地表相关(如DEM和NDVI)因素的重要性明显增加。白天超过42%的地表O₃日变化可归因于太阳辐射(28%)和LST(14%),其它气象因素占31%;夜间TNO₂贡献最大(16%),比白天高出9%,其气象因素占35%,特别是RH和WS。我们结果还揭示了卫星对流层O₃、NO₂和HCHO的关键作用,它们的影响在夜间显著增强,贡献由15%上升至27%。

图4.中国2019年地表O3昼夜变化时间序列和驱动因素分析


MDA8臭氧水平和短期暴露风险

      使用24小时数据,我们首先计算了中国各地的MDA8 O₃浓度,并使用WHO更新的空气质量标准评估了短期O₃污染的风险暴露。MDA8 O₃浓度大多数在81至115 μg/m³的范围内,平均值为98μg/m³。严重污染主要分布在华北平原(尤其是山东、河北和河南省)和华北中部地区。相比之下,其余地区的O₃污染水平相对较低,特别是中国东北和西南地区。关于O₃暴露日常风险,我们发现中国大约43%(61%)的所有(人口居住)地区遭遇严重的O₃污染,至少有一天超过了WHO推荐的短期临时目标1(160 µg/m³)。然而,大多数地区的暴露风险频率通常较低(低于20%)。对于短期临时目标2(120 µg/m³),遭遇一天风险的地区显著增加,所有地区和人口居住区达到97%和98%,暴露频率也迅速增加,一些东部地区的污染持续时间长达半年以上。特别是,对于短期空气质量指导水平(100 µg/m³),中国所有地区(100%)至少有一天暴露于不健康的空气中,风险强度在整个区域范围内从20%到90%不等。这些发现表明短期O₃暴露的严重风险,强调了采取环境保护措施以控制地表O₃污染、改善空气质量并促进未来健康益处的紧迫需求,特别是在人口稠密的地区。


图5.中国2019年(a)中国MDA8 O3浓度的空间分布,以及超过WHO建议的短期(b)临时目标1、(c)短期目标2和(d)空气质量指导水平的天数百分比

地表O3植物毒性指标及影响

      图6展示了2019年中国基于24小时数据计算的6个主要地表O₃植物毒性指数的空间分布。M7和M12的空间模式相似,平均值分别为39.3和40.1 ppb,较高值主要集中在山东省西部地区以及中国北方的零星区域。相反,大多数其它地区的水平较低,尤其是在中国西部、西南和东北地区。AOT0和AOT40之间存在显著差异,其中AOT0的范围为52至84 ppm,平均为66.9 ppm,而AOT40处于6-32 ppm范围内(平均值为15.9 ppm)。这一差异归因于AOT40包含每小时O₃积累的阈值,而AOT0没有阈值。然而,华北平原(特别是山东和天津)、内蒙古的西部和中部地区以及中国东北一些地区(如辽宁)存在极高的AOT0值。AOT40也显示出类似空间模式分布,尽管水平明显较低,但约95%、98%和100%的中国植被覆盖区域超过了AOT40定义的3个临界水平:6、5和3 ppm。SUM06(范围从0到54,平均值为21.9 ppm)和W126(范围从4到44,平均为16.9 ppm)的空间模式与AOT40的模式整体一致,但在华北平原的水平较高。然而,约55%、65%和70%的中国植被覆盖区域分别超过SUM06的3个临界水平:15、10和8 ppm。此外,约23%和82%的植被覆盖区域分别超过W126的2个临界水平:23.8和5.9 ppm。总体而言,2019年中国大多数植被覆盖区域面临着地表O₃毒性污染,华北平原是影响最严重的区域。


图6.中国2019年各地估计的(a)M7(ppb)、(b)M12(ppb)、(c)AOT0(ppm)、(d)AOT40(ppm)、(e)SUM06(ppm)和(f)W126(ppm)空间分布

      我们还定量研究了地表O₃污染对各种植被类型的影响(图7),6个O₃植物毒性指数与四个植被丰度指数之间主要存在负相关关系。显然植被的生长受到地表O₃污染的影响,通过植物毒性反应,损害程度取决于植物种类,这从相关性的不同强度中可以看出。对于农田,AOT0、AOT40和SUM06与各种植被丰度指数(特别是GPP)更为相关。森林对O₃污染也表现出较强的响应,尤其是在AOT0、AOT40和W126方面,敏感性明显增强。对于草地,植物毒性指数与植物丰度指数之间的相关性不断增强,特别是AOT0、M12和M7。在所有植被类型中,AOT0对植被生长变化的响应最为明显,与各种植被丰度指数的相关性最高,其次是M12和M7。总体而言,GPP对地表O₃暴露的敏感性最强,特别是AOT0,与所有植被区域的相关性最强,在农田、森林和草地中也表现出类似的趋势。GPP与其它O₃暴露植物毒性指数始终保持着最强的相关性,进一步证实了这一点。这可以归因于环境O₃能够通过气孔进入叶片,造成生物大分子损伤和细胞死亡;这反过来又减少了叶片的气孔导度和光合作用速率,最终导致初级代谢、叶面积和生物量的下降,以及GPP的进一步降低。


图7.不同植被类型的植被丰度指数与O3暴露植物毒性指数之间的相关性分析


研究结论

本文扩展并选择了表现性能最佳的四维时空-极端随机树模型,首次在中国估算并生成了24小时无缝1公里地表O₃数据集。该数据集显示出地面O₃极其显著的昼夜变化,其白天至夜晚间的波动幅度达到了均值水平的62%。2019年,所有人口居住区至少有一天暴露在不健康的臭氧污染空气中。研究还揭示了不同植被类型中,GPP对地表O₃污染的响应最为明显。


数据共享

本文开发的中国24小时1公里无缝隙地表臭氧数据集已通过Zenodo平台向全球用户免费开放获取,未来会持续更新,欢迎下载使用:
doi:10.5281/zenodo.10035857

研究团队

北京师范大学硕士生程帆为本文第一作者,马里兰大学李占清教授和韦晶助理研究员为论文共同通讯作者,合作者还包括北京师范大学硕士生杨泽宇马里兰大学李若含博士和汪冬冬副教授,卢森堡科学技术研究所贾奥林博士,南京信息工程大学李柯教授,清华大学赵斌副教授王书肖教授,青岛大学薛文晧副教授等。该研究得到了国家自然科学基金重点和青年基金项目的资助。



长按二维码关注我们


生态学者
关注土壤、植物、微生物及动物等领域及交叉学科的最新或经典的研究资讯!欢迎投稿科研进展/专刊征稿/招聘/讲座等,联系邮箱:ecologist_all@163.com亦或添加VX:The-Ecologist
 最新文章