准确和连续地估计亚热带森林的碳密度对于监测陆地碳通量至关重要。中国南方的热带与亚热带森林,因受人为扰动和造林活动影响,是森林扰动较为显著地区之一。高分辨率光学卫星数据有助于提高生物量预测的准确性,与激光雷达结合能取得较好的生物量预测效果,但这两类数据在多云雨南方地区获取是受限的,并且激光雷达波形展宽效应也是山区和热带茂密森林生物量预测的主要问题。
目前,深度学习技术已应用于生物量制图领域,因模型对样本的需求多局限于小范围地区开展。较为广泛使用的随机森林模型均方预测误差(MSPE)包括噪声方差、系统预测偏差和回归预测方差,Breiman和相关学者尝试Bagging方法以降低回归预测方差,但不能缓解系统预测偏差(包括低值高估和高值低估)的问题。因此,本文结合可免费获取的陆地卫星Landsat序列对长时间大范围的南亚热带森林生物量动态预测性能开展研究。
2.研究内容
针对预测因子与目标的时空异质性,我们提出一种基于随机森林的生物量预测新算法。通过样本与遥感像元足迹空间偏差校正、随机森林的系统预测误差探究与校正算法设计,森林生长表征的时谱特征筛选、生物量碳密度预测策略四个方面改进模型的预测精度,并讨论了年龄组间预测和模型外推预测泛化性。研究校正了系统预测误差的极值影响问题,在仅使用Landsat时间序列数据进行模型训练的区域外依然能够较准确的预测森林碳密度。结合连续变化检测和分类(CCDC)算法,提供大尺度碳密度动态的连续、可靠的生物量预测。
3. 研究结论
该研究不仅探讨了森林生长规律的变量表征与常规预测效果,且分析了遥感像元与样本失配的影响、随机森林系统误差改正对SCARF预测提升的贡献,研究结果表明,相比常用的随机森林方法的R2为0.47,均方根误差RMSE为8.52 Mg ha-1,SCARF提高了生物量预测的准确性,R2为0.83, RMSE为6.27 Mg ha-1,在模型训练区域外推预测R2为0.79,RMSE为6.62 Mg ha-1。分别对五个不同林龄组建模,进一步提高预测精度的R2 0.87,RMSE为3.65 Mg ha-1 。SCARF预测和样本的异速生长拟合、时空格局具有较好的一致性,算法可以提供生物量动态连续预测,未来将借助多源卫星遥感数据开展进一步研究。
图1.SCARF算法研究方案
图2.多模型生物量预测场景比较:(a)随机森林,(b)级联随机森林,
(c)空间失配校正+随机森林, (d) SCARF算法
图3.样本和SCARF预测值比较:(a)异速生长模型拟合(b)林龄组预测评估
图4. SCARF算法的广州生物量动态预测案例
研究成果以“SCARF: A new algorithm for continuous prediction of biomass dynamics using machine learning and Landsat time series”为题,在国际学术期刊《Remote Sensing of Environment》上发表。华南师范大学付迎春教授为通讯作者,与丁浒副教授、康涅狄格大学朱喆教授、南京林业大学等多个机构合作发表,该研究得到国家自然科学基金项目(42071399, 42371432)支持。
论文链接: