植被总初级生产力(GPP)在碳循环和全球变暖中具有重要作用,但区域和全球GPP估计仍存在较大不确定性。遥感模型因其在大尺度监测中的优势,成为GPP估算的重要工具,主要包括回归模型、参数模型、过程模型和机器学习模型。尽管这些模型各具特点,但普遍依赖植物功能类型(PFT)和多源数据,如气象和土地覆盖数据。由于PFT仅是植被的简化表示,且遥感像元常包含多种植被类型,传统模型在复杂区域的精度受限。此外,气象数据的分辨率和不确定性也影响估计结果。为提高GPP估算精度,研究提出一种端到端遥感(ETES)模型,旨在通过植被指数时间序列和机器学习算法改进GPP估算的准确性,并与现有产品进行比较。1.1 通量数据
使用FLUXNET 2015数据,筛选出85个站点、10种植被类型的110,530个站点日记录。遵循数据质量要求,使用下向短波辐射数据评估卫星短波资料对GPP估计的影响,以GPP_VUT_NT作为模型性能评估依据。1.2 遥感数据
研究采用GLASS短波辐射数据代表光合作用能量输入,MCD43A4波段用于叶绿素含量和水分胁迫,MODOCGA波段反映叶黄素变化,MOD11A1用于温度应力。所有数据与站点日记录配对,经过质量过滤并重新采样至1 km × 1 km分辨率,同时考虑周围24个像元以测试空间泛化能力。1.3 GPP产品
研究评估了MOD17、GOSIF、GPP-NIRv和Fluxcom等128个ETES产品的性能。最终研究使用了RS版本,因为RS版本的遥感数据输入相对纯粹。为有效捕捉输入变量与GPP之间的非线性关系,研究采用机器学习框架构建了ETES模型。使用多层感知机(ANN)对输入变量与GPP的关系进行建模,并通过对比实验筛选最优输入变量。地面观测数据(FLUXNET)和其他GPP产品(MOD17、GOSIF、GPP-NIRv和Fluxcom)用于评估模型性能。图1 流程图
2.1 光合作用相关的输入变量
研究将影响光合作用的因素分为三类:太阳能吸收、环境胁迫条件和植被特征(如叶绿素含量和植物功能类型PFTs)。在模型构建中,针对每一类影响因子,选择了具有代表性的遥感波段。光合作用受到光合有效辐射(PAR)驱动,环境胁迫条件(如温度和湿度)会限制植物生长,植被特征则通过生理状态、植被类型和物候的差异影响GPP积累。图2 光合作用相关影响因素及其遥感指标。(a)与光合作用有关的过程和变量。图180显示了叶片尺度上光合作用的概念,向上的光(反射率、散热和SIF)包含了卫星可捕获的信息181。(b)与光合作用有关的遥感变量。图中显示了陆地182光合作用监测的相应波段。SIF,太阳诱导叶绿素荧光;NIRv,植被指数等于NIR × NDVI。
2.2 特征变量筛选
为了减少遥感特征变量之间的共线性并评估变量的重要性,研究进行了特征选择实验,测试了不同变量组合。基于两个原则,选择了能代表光合作用影响因子的变量组合,并确保具有足够的元数据。通过SHAP值评估变量的贡献,最终根据均方根误差(RMSE)、决定系数(R2)、变量贡献和数据可用性,确定了最优模型变量集。2.3 机器学习框架
为了构建ETES GPP估计模型,研究采用了多层感知器(MLP)这一人工神经网络框架,具有三个隐层。采用10倍交叉验证方法训练模型,最终结果为10次结果的平均值。模型使用非线性激活函数(sigmoid),损失函数为均方误差(MSE),并通过早期停止(patience设为25 epoch)和Adam算法优化学习率,防止过拟合。训练集与测试集不包含相同站点,以减少过拟合的风险。2.4 精度评价
为了评估ETES模型的准确性和泛化能力,研究设计了两个比较实验:一是与其他GPP产品的估算精度比较,二是不同植被类型间的估算精度比较。由于现有GPP产品没有每日估算,ETES的每日结果被转换为8天/月/年的尺度进行比较。使用RMSE和R²量化准确度,并通过年际比较评估ETES的空间和年际变化能力。研究还评估了ETES的规模效应和近实时监测能力,测试了土地覆盖变化情况下的监测效果,并分析了不同空间尺度下的效果,为全球GPP估算提供参考。图3 筛选试验中各组合方案的比较。(a)每日GPP估算的R2比较;(b)每日GPP估算的均方根误差比较;(c)方案间相对特征重要度比较。
3.1 光合作用相关变量的最佳组合
基于SCVTG的GPP估算方案(A、B、C、D、E)与使用PFT的方案(A'、B'、C'、D'、E')相比,准确度波动较大,但SCVTG方案对其他输入因素的变化较为稳定,而PFT方案则在输入变量变化时表现出显著的波动。例如,方案B'(基于PFT)相比A'方案(基于PFT)准确性有显著差异,而SCVTG的A和B方案在准确度上没有显著区别。此外,使用地面观测短波辐射数据的方案精度波动较大。在不同组合方案下,NIRv和绿波段的特征重要性较高,表明这两个波段的变化对GPP估计的影响较大。总体而言,SCVTG对GPP估算的贡献较PFT更为显著。综合考虑精度、数据可用性和可解释性,方案C被选为最优模型变量组合。虽然方案C与其他SCVTG方案精度无显著差异,但由于不包含窄带或TIR波段,数据可用性更高。此外,SCVTG变量的可解释性优于PFT,尤其是SCVTG中的VBottom和L20与反射率数据的表现相似,能够更好地反映光合作用过程的物理意义。图4 比较方案C和方案C之间各输入变量对GPP估计的贡献。(a) C方案中各输入变量的SHAP值(基于SCVTG)。(b)方案C’中各输入变量的SHAP值(基于PFTs)。
3.2 GPP估计的准确性
ETES模型的GPP估算精度明显高于其他同类GPP产品,尤其是在年尺度上的表现。与其他模型相比,ETES在所有时间尺度上(特别是年尺度)表现出更低的RMSE和更高的R²值,这表明ETES能够有效捕获日尺度、季节性变化及年际变化的GPP波动。相比之下,其他GPP产品(如Fluxcom)主要在日月尺度上表现良好,但ETES克服了现有模型“高观测低估计”的问题,取得了更好的结果。在不同的植被类型上,ETES展现了优秀的时空泛化能力,能够与其他GPP产品(如Fluxcom和GOSIF)媲美,甚至在某些类型(如DBF、EBF、MF和WSA)上具有优势。尤其在月度尺度上,ETES在多个植被类型中表现优于其他模型,尽管GOSIF在某些类型的日尺度表现更好。ETES在近实时估算中也显示了强大的能力,虽然与事后估算相比精度略有下降(ΔRMSE = +2.0%,ΔR² = -1.4%),但仍保持较好的估算精度。特别是,当使用5 km卫星数据进行近实时估算时,ETES的精度略有下降,ΔRMSE = +9.9%,ΔR² = -8.5%,但整体表现仍然令人满意。
总体来看,ETES通过特殊的输入变量和非线性模型结构,在捕捉GPP变异性和提高估算精度方面表现出色。此外,其较高的数据可用性支持了相对较高的空间分辨率,从而进一步提升了模型的精度。图5 不同时间尺度下总体GPP精度的比较。8个每日比较:(a) MOD17, (b) GOSIF, (c) Fluxcom, (d) ETES。每月比较:(e) MOD17, (f) GOSIF, (g) GPP-NIRv, (h) Fluxcom, (i) ETES。年度比较:(j) MOD17, (k) GOSIF, (l) GPP-NIRv, (m) Fluxcom, (n) ETES。蓝紫色表示散射密度较低,黄绿色表示散射密度较高。
ETES模型通过选取下短波辐射、反射率数据(蓝、绿、红、近红外、SWIR)和SCVTG变量,结合非线性建模方法,显著提高了GPP估算精度,特别是在植被组成复杂的地区。与传统的PFT模型相比,ETES能更好地适应非典型区域,减少了对气象数据和PFT参数的依赖,提升了数据可用性和模型的自适应能力。尽管存在低生产力地区适用性和冗余信息问题,ETES依然在遥感GPP估算中表现出较强的优势和广泛的应用潜力。
DOI:https://doi.org/10.1016/j.agrformet.2023.109337