研究背景
空气污染已成为全球性环境健康问题,臭氧O₃作为一种强氧化剂,虽然在平流层有保护作用,但在地表会严重影响空气质量和生态系统,并对人类健康构成威胁,诱发呼吸道和心血管疾病。近年来,中国政府采取有功效措施大幅度减少了细颗粒物浓度,但臭氧浓度却不断攀升,抵消了部分空气质量改善带来的健康收益。由于地面观测数据空间覆盖不足,许多研究尝试利用卫星遥感技术估算地表臭氧浓度。然而,先前研究时间跨度短、空间分辨率较低,难以满足臭氧污染长期趋势以及城市尺度空气质量精细化分析等需求。为解决这一问题,我们团队基于地面臭氧观测数据和卫星反演的地表短波太阳辐射和气温数据,开发了多维时空-深度森林模型,重建了中国2000年至今逐日地表MDA8臭氧浓度数据集,空间分辨率高达1公里,每日数据空间覆盖完整。通过这一独特的数据集,我们详细分析了中国过去二十年臭氧时空变化模式、人口暴露风险及死亡负担。这一研究填补了我国长期、高分辨率地表臭氧数据的空白,为精确评估空气质量与公众健康提供了坚实的数据基础。
研究方法
本研究使用中国生态环境部(MEE)提供的2013年以来臭氧数据作为深度学习模型的真实训练输入数据。此外,我们还使用了TOAR对流层臭氧评估报告数据库中的观测数据,作为独立验证集。在模型方面,本研究应用改进的四维-时空深度森林(4D-STDF)模型,通过极坐标系和螺旋形三角函数向量以提高对空气污染物高时空异质性的捕捉能力。在输入变量方面,我们使用卫星反演的1公里地表短波太阳辐射和温度两个关键气象变量,以及清华大学ABaCAS-EI提供的1公里逐日排放清单,提供臭氧生成的关键气态前体物等,实现中国1公里地表O₃浓度的高精准建模。
对于地表O₃长期趋势分析,我们采用断点检测方法,通过滑动窗口评估断点两侧趋势的变化幅度、方向差异及显著性概率,以确定长时间序列中可能存在的趋势反转点。对于O₃污染人口暴露风险评估,我们基于世界卫生组织WHO最新空气质量指南设定的长期和短期的O₃浓度目标值:对于长期暴露评估,我们计算暖季O₃浓度超过WHO长期空气质量标准的区域占比及受影响的人口比例;对于短期暴露评估,我们统计一年中每日O₃浓度超过WHO短期空气质量标准的天数及受影响的人口区占比。对于死亡负担,我们分别使用全球疾病负担研究(GBD)以及中国大型队列人群研究提供的臭氧暴露-死亡响应函数,估算每年由长期和短期O₃暴露导致的过早死亡人数。
图1.本文改进的ChinaHighO3数据生产框架流程图
研究结果
深度学习模型性能评估
我们使用收集的中国2013-2021年约420万数据样本进行验证(图2),基于样本的10折交叉验证方法显示,我们模型能够准确反演中国逐日地表MDA8臭氧浓度,整体精度达到89%,均方根误差(RMSE)为15.77 μg/m3。基于站点的交叉验证结果表明,模型具有较强的空间预测能力,能够较好地预测没有观测站点位置的地面臭氧浓度,预测精度为84%,RMSE为18.74 μg/m3。此外,我们的模型在区域尺度上表现也非常出色,特别是在京津冀(CV-R2 = 0.92)。值得注意的是,与先前10公里臭氧数据集相比,本文1公里数据的总体精度整体得到改善(CV-R2增加了1.1%,RMSE减少了3.4%)。基于TOAR观测数据的独立验证结果表明,模型能够较准确地预测2013年之前的历史地面O₃浓度,预测值与真实值在日、月和暖季尺度上的相关系数均超过0.8。我们还利用后续年份(2016年后)的数据样本建模,分别预测2015、2014和2013年的O₃浓度,并与观测数据进行对比。独立验证结果表明,模型关于日浓度的预测精度比较可靠,两者间的相关系数稳定在0.9,斜率大于0.8。这些结果可以说明我们的模型在重建历史(特别是2013年之前)地表臭氧浓度方面具有较强的稳健性。
图2.中国2013年至2021年地表臭氧日、月和暖季浓度估算的交叉验证结果
地面臭氧浓度变化趋势
图3展示了过去二十年中国每年暖季地表O₃浓度的空间分布。22年间中国北方大部分地区的环境O₃水平持续较高,超过120 µg/m³,尤其在华北平原和长三角形成了显著的热点。然而,中国西南地区和黑龙江省,O₃污染相对较低。从时间上看,地表O₃浓度经历了较大的波动:2000-2016年期间基本保持稳定。整体上,京津冀和华北平原O₃污染更为严重,持续超过100 µg/m³,这归因于北方重工业活动导致较高的前体物排放量。相比之下,珠三角O₃污染较轻。然而自2017年以来,中国O₃浓度显著上升,尤其在东部和北部,这凸显了进一步改善中国空气质量的挑战。2019年,中国O₃浓度达到最高,华北平原和京津冀地区的情况更为严重。此外,珠三角在2000年后首次超过100 µg/m³。2019年后,全国O₃污染有所下降,华北平原尤为显著。与其他省份相比,2016-2021年西藏地表O₃增加更为显著,这是因为更频繁的平流层-对流层交换事件导致平流层O₃入侵,显著增加了当地地表O₃污染,尽管O₃前体物(如NOx和VOCs)的水平相对较低。
图5.中国和三个典型城市群不同时期内城市和农村地区暖季地面O₃浓度对比
图6.中国及不同区域2000-2021年间每年超出WHO设定的短期空气质量标准至少1天、1周、1个月和1个季度的区域百分比
图7.中国2000-2021年间各省长期暴露于地表臭氧所致的累计死亡人数的空间分布
为何需要高分辨率数据?
空气质量数据集的空间分辨率会影响空气污染评估和死亡负担的准确性和有效性。我们通过比较1公里和10公里数据(图8),发现在特定日子,1公里分辨率的日均臭氧数据能更准确地识别城市层次的臭氧污染差异,提供了更详细的信息,并展示了城市内部臭氧污染的明显梯度变化。例如,在“2+26”城市群中,使用高斯曲线拟合频率分布时,1公里的日均臭氧数据相较于低分辨率的数据具有更高的最大值。峰值可能存在较大差异,相对差异甚至可达18%。这种差异在长三角和珠三角等重要都市群中尤为显著。此外,1公里数据还在内陆河流、湖泊和陆海交界处提供了更广泛的空间覆盖。总体而言,相较于1公里数据,10公里数据会低估全国日均臭氧污染水平约5%。从暴露条件来看,长期使用较粗10公里臭氧数据在全国范围内平均低估了约2%。然而,随着人口加权臭氧浓度差异的增大,过早死亡人数的差异也显著扩大:每增加1%的差异,因臭氧污染导致的死亡人数在2013年前会增加1%,而在2013年后则增加4%。特别是,长期暴露于地表臭氧的死亡率趋势被低估了13%。这种低估在短期寿命损失率上更加显著,在中国达到20%,在关键城市群也得到了进一步证明,如长三角和珠三角(51%和21%),突显了高空间分辨率数据在评估短期和局部(尤其是城市)空气质量及公共健康中的重要性。
图8.中国及典型城市区域1公里和10公里日均地面臭氧浓度的空间分布和高斯分布比较
研究结论
本文利用卫星遥感和人工智能重构了中国2000年以来首个无缝逐日1公里日均最大8小时臭氧浓度数据集。利用该数据揭示了过去二十多年来地表臭氧浓度的动态变化趋势,发现了城市地区的暖季臭氧水平比农村高出约12%。此外,研究结果显示,由于地表臭氧暴露风险的上升,因长期臭氧暴露而导致的过早死亡人数每年增加了953人。该研究不仅填补了长时间序列高分辨率臭氧数据的空白,也为评估空气污染的健康影响提供了更为精确的基础。
数据分享
本文重构的中国2000年以来逐日1千米地面臭氧数据可通过多个平台免费在下载获取,欢迎大家下载使用,多提宝贵意见:
https://doi.org/10.5281/zenodo.10477125
https://data.tpdc.ac.cn/zh-hans/data/87753867-77c8-42f1-b2e6-da569679635f
https://geodata.nnu.edu.cn/data/datadetails.html?dataguid=234801851485751&docid=2
研究团队:
北京师范大学硕士生杨泽宇为本文第一作者,马里兰大学李占清教授和韦晶助理研究员为共同通讯作者,合作者还包括南京信息科技大学李柯教授、电子科技大学张涛副研究员、香港大学周宇宇教授、清华大学赵斌副教授和青岛大学薛文晧副教授等。该研究得到了国家自然科学基金重点和青年项目的资助。
长按二维码关注我们