长白落叶松-水曲柳混交林单木叶面积预估模型
王越,苗铮,郝元朔,刘鑫,董利虎*
东北林业大学林学院
关键词:长白落叶松-水曲柳混交林; 相对权重; 混合效应; 经验线性无偏最优预测法; 叶面积
基金项目:国家重点研发计划(2022YFD2201001)。
引文格式:王越, 苗铮, 郝元朔, 等. 长白落叶松-水曲柳混交林单木叶面积预估模型[J]. 南京林业大学学报(自然科学版), 2024, 48(5): 235-245.WANG Y, MIAO Z, HAO Y S, et al. A single tree leaf area prediction model in the Larix olgensis and Fraxinus mandshurica mixed forest[J]. Journal of Nanjing Forestry University(Natural Science Edition), 2024, 48(5): 235-245.DOI:10.12302/j.issn.1000-2006.202311012.
下面跟学报君一探究竟!
董利虎,男,教授,博士生导师,东北林业大学林学院副院长,主要从事森林生长模型及模拟、森林生物量和碳储量估算、森林资源调查方面的研究。
王越,男,硕士研究生,研究生期间主要从事单木叶面积预估模型方面的研究。
【目的】构建长白落叶松-水曲柳单木叶面积模型,以提升长白落叶松-水曲柳人工混交林单木叶面积的预测精度,了解模型变量与叶面积关系,为进一步研究林分生产力和树冠结构提供理论基础。【方法】选取黑龙江省尚志市不同混交比例长白落叶松-水曲柳混交林中111株落叶松以及113株水曲柳,测量其叶面积。采用全子集回归法建立两树种的非线性单木叶面积预估模型。通过相对权重法分析各变量对模型的贡献,同时考虑样地对叶面积的随机影响,构建混合效应模型,并对模型进行评价。【结果】相对权重计算结果显示,在最优模型中,胸径(DBH)对长白落叶松和水曲柳单木叶面积的影响最大。考虑样地层次随机效应的最优长白落叶松单木叶面积混合效应模型包括冠长率(PCR)、DBH、林木树高与林分优势木平均高之比(PHDH),模型调整后的决定系数()为0.89,均方根误差(RMSE)为11.68 m2,平均偏差(ME)为-0.202 7 m2,平均绝对偏差(MAE)为7.943 0 m2,预测精度(Pa)为99%;考虑样地层次随机效应的最优水曲柳单木叶面积混合效应模型包含PCR、DBH、PHDH及冠幅(PCW),模型的为0.87,RMSE为13.61 m2,平均偏差(ME)为-0.281 7 m2,MAE为9.397 6 m2,Pa为99%,具有较好的拟合和预测效果。【结论】考虑样地水平的混合效应模型提升了两树种单木叶面积预测准确性,DBH是影响单木叶面积最重要的变量,且在混交林叶面积模型中考虑林木竞争变量是有必要的,建立的模型可为准确预测长白落叶松和水曲柳单木叶面积提供技术支持,同时有助于深入研究林分的生长发育和树冠结构。
叶面积是反映植物净初级生产力的植物叶片特征。叶面积估计有助于在林分、景观和区域尺度上研究碳、能量和水分通量,并计算出树木的生态效益价值。传统上,获取叶面积数据需要耗费大量人工与时间成本,并进行破坏性取样,不适用于固定样地的长期研究。通过建立由易测因子组成的叶面积预测模型,可以有效解决上述问题。
在单木叶面积的研究中,常用的是树木水平的变量,如胸径、边材面积、高径比、树高和树冠属性变量等,多数情况下采用非线性模型形式。O’Hara等使用树木水平变量比较线性和非线性模型对叶面积的拟合效果,结果显示包含树冠与高径比的非线性模型精度最高。Monserud等与Utsugi等采用异速生长形式的非线性模型拟合叶面积;谢龙飞等则在非线性模型基础上进行对数转化,并引入混合效应。除了树木水平变量,一些学者还引入了林分水平变量,如树冠竞争因子、每公顷株数、混交度、相对树高等变量。在这些变量中,描述林木竞争的因子相对其他因子表现更出色。从管道模型理论出发,竞争对胸径的影响与树冠的状态密切相关,且在胸径模型的研究中,通常首要考虑竞争因子,因此讨论竞争对叶面积的影响显得尤为重要。使用相对权重法可以很好地解释变量对模型产生的贡献并对变量进行排序,有助于探究和验证假设。该方法广泛应用于教育学和心理学等社会科学领域,但在单木叶面积领域的应用尚鲜见报道。
长白落叶松(Larix olgensis)是我国东北地区速生丰产的一种主要造林树种,水曲柳(Fraxinus mandshurica)是我国东北三大硬阔叶树种之一。长白落叶松-水曲柳混交林较纯林具有更好的林分微环境,更优良的地上和地下结构,更缓和的资源竞争和更充分利用林分空间等优势。对单木叶面积的研究可以为改进经营措施、加速林分生长、计算林分生态效益等方面提供基础。
目前关于竞争指标对叶面积影响的研究相对有限,尤其是使用非破坏性取样获得的变量进行混交林叶面积的研究。此外,混合效应模型的应用也大多限于纯林。
因此,本研究将单木叶面积混合效应模型的应用扩展到混交林中。选取黑龙江省长白落叶松-水曲柳人工混交林解析木数据,结合胸径、树冠属性因子等易测因子和与距离无关的竞争指标等变量作为预选变量,以全子集回归的方式挖掘现有变量组合中预测精度最佳的模型。使用相对权重法直观地展示叶面积模型中的变量对模型的贡献程度,并引入样地层次的混合效应,建立两树种的单木叶面积混合效应模型,以提升长白落叶松-水曲柳人工混交林单木叶面积的预测精度,并进一步认识模型变量与叶面积的关系,以便进一步开展林分生产力和树冠结构的研究。
本研究中长白落叶松与水曲柳数据分别来源于黑龙江省尚志市辖区内林场:一面坡林场(127°59'9″~128°18'43″E,44°52'43″~45°11'54″N)、小九林场(127°38'27″~127°51'37″E,45°11'29″~45°25'5″N)、尚志林场(127°39'32″~127°35'9″E,45°0'08″~45°23'28″N)和帽儿山林场(127°18'0″~127°41'6″E,45°2'20″~45°18'16″N)。各林场属于尚志国有林场管理局管辖,位于长白山张广才岭的西坡,为山地丘陵,主要土壤类型为黑褐色壤土。气候类型为中温大陆性季风气候,环境和气候条件总体上相似。
2017—2018年在一面坡林场、小九林场、尚志林场、帽儿山林场分别选择不同林龄和不同混交比例的长白落叶松-水曲柳混交人工林进行固定样地的设置。在12个混交林内均重复设置3块相同大小的样地,共分别设置9、18、3和15块长白落叶松-水曲柳混交林标准地。所设样地均为矩形,长度为50或30 m,宽度依混交比例而定,需囊括3个混交带。混交带定义为一个栽植重复内的长白落叶松行数与水曲柳行数之和,株行距为1.5 m×2.0 m。所有样地面积为0.06 ~0.32 hm2。样地设置后,将样木逐一编号,并进行每木检尺,起测胸径(DBH)5 cm,样地基本信息见表1。根据等断面积径级标准木法在标准地块附近选取5株解析木,再根据林分的最大和最小胸径,选取1株优势木和1株劣势木,共7株,在部分样地选取少量幼树。所有树木长势良好,树冠形状完整且正常,树干通直且无病虫害。共获取长白落叶松111株(其中幼树6株)解析木数据,水曲柳113株(其中幼树9株)解析木数据,各样地样木因子如表2所示。
在伐倒前,测量每1株解析木的胸径(DBH)和冠幅(CW);然后,在选取紧贴地面的合适方向将树木伐倒,用皮尺贴近树干测量从树干基部到梢头的距离,即树高(HT);标记树冠基部位置后测量其到梢头的距离,即冠长(CL)。每轮选取一个枝条作为标准枝,彻底去除叶片,并称量枝条叶片的鲜质量;同时,收集标准枝条的枝叶。对于其余枝条,测量带枝的鲜质量,以便计算叶面积。采用测量法获取长白落叶松叶面积:首先,从标准枝条中取得1~2 g样叶,按照大小进行分组;使用游标卡尺测量每组平均叶片的长度、宽度以及厚度(每组选取3~5个叶片),计算出叶面积。水曲柳叶面积测量采用打孔测量法。每轮选取50枚叶片称质量,利用打孔器在叠加的叶片上打孔;然后称量打孔取下叶片的质量,根据打孔器孔径面积与质量比例之间的关系计算叶面积。最后,依据所取叶片样本的叶面积与叶鲜质量,计算单位质量的叶面积转换系数,并利用枝条叶鲜质量计算每个标准枝的叶面积。通过每轮标准枝的枝叶比重计算出该轮所有枝条的鲜叶质量,并利用标准枝的叶面积与叶鲜质量比值得到其余枝条的叶面积。将长白落叶松所有枝条以及水曲柳的叶面积求和,得到长白落叶松单木叶面积;将水曲柳所有枝条以及小叶叶面积求和,获得水曲柳单木叶面积。
▼表 1 长白落叶松-水曲柳混交林样地信息基本统计量
1.3.1 树冠叶面积模型的建立
绘制散点图以分析预选变量与单木叶面积之间的函数关系。两树种预选变量与单木叶面积的散点图见图1。经过观察,发现预选变量与单木叶面积之间呈现异速生长关系,可以用公式y=axb描述。其中:y为叶面积,x为响应变量,a、b均为参数。因此,在获取预选变量后,采用异速生长方程形式建立单木叶面积的非线性模型。通过全子集回归结合向后剔除法,以调整后的决定系数为指标初步筛选模型,得到最佳的几个模型。然后,结合均方根误差(RMSE)的筛选,得到最优的基础模型。
1.3.2 相对权重法的基本原理
相对权重法在重要性评价中广受应用。它是对所有可能的子模型添加一个预测变量后引起的决定系数(R2)平均增加量的近似值,通过此方法可以直观地确定每个变量对R2的贡献。相对加权法通过原始变量对正交变量,以及因变量对正交变量形成线性回归方程,自变量的相对重要性是两组回归系数的平方之和。3个变量的相对重要性示意图见图2。以自变量X1为例,其与因变量的关系可以转换为两个相互独立的方程:原始变量(Xi)与正交变量(Zk)的回归方程以及正交变量与因变量(Y)的回归方程。
第1个方程表达式如下:
式中:βk为回归系数。因此,可得到X1的相对权重ε1的表达式如下:本研究中将对非线性模型进行对数转化后分析变量的权重。
1.3.3 混合效应模型
本研究使用混合效应模型预测叶面积,以反映难以表达的差异对叶面积带来的影响。混合效应模型是一种统计模型,用于分析具有多层次结构的数据。该模型将总体效应分解为固定效应和随机效应两部分,同时考虑了固定因素和随机因素对响应变量的影响。与传统模型相比,混合效应模型具有更灵活的误差ε结构,能够容忍相关性和异方差。模型随机参数的协方差结构也可用于解决误差ε的异质性和自相关问题。本研究基于基础模型,采用样地层次的随机效应,建立单水平的非线性混合效应模型。混合效应模型形式如下:
式中:Yi为第i个类别中的ni×1次观察值;f是包含参数向量Φi和协变量向量vi的非线性函数;Xi为ni×p维固定效应设计矩阵;β为p×1维固定效应参数向量;Zi是ni×q维随机效应设计矩阵;bi是q×1维随机效应参数向量,且bi期望为0,G为q×q维的随机参数方差-协方差矩阵,协方差cov(bi,bj)=0,i≠j表示bi间彼此独立;ε为ni×1维误差向量,期望为0,方差为σRi,σRi为ni×ni维组内误差方差-协方差矩阵矩阵;ε和bi的协方差为0。 建立混合效应模型需要有以下几个步骤:
1)确定随机效应参数。建立混合效应模型时,首先需要确定模型中的固定效应参数和随机效应参数。本研究通过穷举所有随机效应参数位置的组合来计算随机效应。在一系列模型比较标准下,获得不同随机参数个数下的最优结果,最后利用似然比检验确定最优参数位置。
2)确定随机效应参数的方差-协方差矩阵结构。若随机效应个数大于或等于2,则需选取合适的方差-协方差矩阵。常用的矩阵有3种,分别是复合对称矩阵(CS)、对角矩阵(DM)、广义正定矩阵(UN)。在满足混合效应假设的前提下,本研究通过赤池信息量准则(AIC)、贝叶斯信息准则(BIC)和对数似然(LogLik)选择最优方差-协方差矩阵结构。
3)确定组内的方差-协方差矩阵。在解决异方差与随机变量相关性的重要手段中,组内方差-协方差矩阵在本研究中的应用是关键的。由于枝条之间与样木之间不存在相关关系,在组内的方差-协方差矩阵中采用独立结构,结构如下:
1.3.4 非线性模型异方差消除
在单木叶面积的非线性模型中,可能出现异方差现象,而异方差的存在会影响模型参数的估计结果。模型残差方差通常与一个或多个变量相关。本研究采用加权回归的方法来消除异方差,其中权函数为,Xi为模型变量,δ由残差的方差和模型变量进行线性回归估计得到。
1.3.5 模型评价和检验
本研究使用R语言4.2.2版本计算非线性模型和混合效应模型。综合采用调整后的决定系数()和均方根误差(RMSE,式中记为σRMSE)作为拟合的评价指标评价模型。为确保单木叶面积模型具有良好的泛化能力,检测和预防模型过拟合的情况,并结合对样本的充分利用以及研究结果客观性等方面的需求,采用留一验证(LOOCV)的交叉验证形式来检验模型。与RMSE的公式表达如下:
式中:yi是观测值;是预测值;是观测值均值;n是观测样本量;λ是模型参数个数。取值为0~1,且越接近1预测效果越好;RMSE越接近0预测效果越好。在使用留一验证检验混合效应模型时,需要重新计算测试集中的随机效应参数,本研究中参数由EBLUP法计算,公式如下:
式中:uk是与样地k相对应的随机效应参数向量,D是随机效应的方差-协方差矩阵,Z是根据模型中每个随机效应参数的偏导函数值得到的随机效应设计矩阵,Mk源自误差的方差-协方差矩阵,Mk与D是模型拟合时的估计值,εk由响应变量的观测值和固定效应预测值的差值组成。在获得模型预测后,利用平均偏差(ME)、平均绝对偏差(MAE)和预估精度Pa评价模型的预测精度。
式中:σME平均偏差;σMAE为平均绝对偏差;yi是观测值;是预测值;n是观测样本量;p是模型参数个数,t0.05是95%置信水平下的t值;为平均预测值。MAE、ME越接近0预测效果越好,Pa取值越接近100%预测效果越好。
▲图1 长白落叶松与水曲柳预选变量与单木叶面积关系图
全子集回归生成了大量的模型组合。经过筛选后排名前5的模型及其模型参数见表3。考虑到模型的精度和复杂程度,最终选择模型1作为长白落叶松叶面积的基础模型,选择模型6作为水曲柳叶面积的基础模型。二者表达式如下:
式中:SCLAa为长白落叶松叶面积;SCLAb为水曲柳叶面积;PCR为冠长率;DBH为胸径;PHDH为林木树高与林分优势木平均高之比;PCW为冠幅;β0,β1,β2,…,β8为待估参数;ε为误差项。
▼表3 长白落叶松与水曲柳单木叶面积备选模型表达式
相对权重法的计算结果见表4。长白落叶松与水曲柳的单木叶面积模型中胸径均为占比最大的变量,约52.95%和36.45%。冠长率均为占比最小的变量,约5.09%和12.02%。
通过计算表3模型集合中各变量的相对权重之和,得到相对权重之和的排列次序,如图3所示。在图3a中,影响长白落叶松单木叶面积最大的变量是胸径(DBH),以及林木树高与林分优势木平均高之比(HDH),其权重之和分别为187.06%和128.51%;其次是冠长(CL)、高径比(HDR)和林木胸径与林分平均胸径之比(RDBH),权重之和分别为68.45%、63.67%和39.21%;影响最小的是冠长率(CR),权重之和为13.10%。在图3b中,影响水曲柳单木叶面积最大的变量是胸径与林木树高与林分优势木平均高之比,其权重之和分别为177.95%和91.03%;其次是冠幅、冠长、高径比,权重之和分别为68.86%、65.57%、55.57%。影响最小的是冠长率,权重之和为41.02%。
▼表4 长白落叶松与水曲柳单木叶面积模型变量的相对权重
长白落叶松与水曲柳单木叶面积在不同随机效应参数下的拟合结果见表5。
在模型中引入样地层次的随机效应后,比较了不同随机效应方差-协方差矩阵结构,发现当使用广义正定矩阵时,模型的AIC、BIC和LogLik值均小于其余两种矩阵结构。因此,选择广义正定矩阵结构作为随机效应方差-协方差矩阵。
在不同混合效应参数个数下的最优混合效应模型中,如果某个参数个数下所有模型均未收敛,则不予列出。对于长白落叶松单木叶面积混合效应模型,似然比检验结果显示,在95%置信水平下,模型(12-2)与模型(12-3)的检验结果均不显著(P>0.05),而模型(12-1)与基础模型的检验结果非常显著(P<0.05),因此,模型(12-1)被确定为最优模型。该模型具体形式如下:
水曲柳单木叶面积混合效应模型的似然比检验结果显示,在95%置信水平下,模型(13-2)的检验结果不显著(P>0.05),模型(13-1)与基础模型的检验结果非常显著(P<0.05),因此,模型(13-1)被确定为最优模型。该模型具体形式如下:
基础模型与最优混合效应模型的残差见图4。残差图显示,经过加权的基础模型和最优混合效应模型的残差分布较均匀,没有明显的异方差。长白落叶松与水曲柳单木叶面积模型评价和检验结果见表6和表7,最优长白落叶松单木叶面积混合效应模型的RMSE为11.68 m2,为0.89,相较于基础模型有小幅提升。在留一验证结果中ME值与MAE值分别为-0.202 7和7.943 0 m2,相比于基础模型分别减少了65%和5%;预测精度Pa为99%,提升了1%。最优水曲柳单木叶面积模型的RMSE为13.61 m2,为0.87。在留一验证结果中,ME值和MAE值分别为-0.281 7和9.397 6 m2,Pa为99%,说明两树种的单木叶面积混合效应模型表现都较好。
▲图4 单木叶面积基础模型与最优混合效应模型预测值-标准化残差分布图
▼表7 长白落叶松与水曲柳单木叶面积模型的检验结果
以往学者在选择单木叶面积变量时更多地采用树木水平的变量,本研究考虑了与距离无关的竞争指标以及其他易测因子,建立了长白落叶松和水曲柳的单木叶面积非线性模型。最终,选取了以PCR、DBH、PHDH为自变量的4参数非线性模型作为长白落叶松的最优单木叶面积模型。在引入样地层次的随机效应后,当DBH作为随机效应参数时,它成为最优混合效应模型。对于水曲柳,选取了以PCR、DBH、PHDH、PCW为自变量的5参数非线性模型作为最优单木叶面积模型。在引入样地层次的随机效应后,当PCW作为随机效应参数时,它成为最优混合效应模型。两树种的模型变量均呈现正相关的异速生长关系,与散点图相符。长白落叶松单木叶面积混合效应模型的与RMSE分别为0.89和11.68 m2,在留一交叉验证结果中,模型检验指标ME为-0.202 7 m2,MAE为7.943 0 m2,Pa为99%,相较基础模型,该模型在预测上表现良好。水曲柳单木叶面积混合效应模型的与RMSE分别为0.87和13.61 m2,模型检验指标ME为-0.281 7 m2,MAE为9.397 6 m2,Pa为99%,相较基础模型,该模型在预测上也表现出较好的效果。
相对权重法的计算结果描绘出了混交林中两树种对宏观环境的响应。表4的分析结果显示,反映林木所受的林分竞争强度的DBH与反映林木所在冠层位置的PHDH是影响混交林中长白落叶松单木叶面积的重要变量。最优的长白落叶松单木叶面积模型中,各变量依模型的权重占比由高到低为DBH、PHDH、PCR,其中胸径相对权重占比约52.95%。DBH与PHDH也是影响水曲柳单木叶面积的重要变量,最优的水曲柳单木叶面积模型中,各变量依模型的权重占比由高到低为DBH、PHDH、PCW、PCR,其中胸径相对权重占比约为41.20%。与长白落叶松模型不同的是,PCW在水曲柳模型中表现显著,且在最优模型中占据较大的比例(约21.78%),与Weiskittel等的结论相似。此外,竞争指标在拟合长白落叶松与水曲柳的单木叶面积中也占据一定比例,因此在混交林中考虑林木竞争变量是必要的。在预选变量构造的全子集回归模型中,DBH、PCR、CL、PHDR与PHDH共同出现在两树种排名前5的模型中。除此之外,DBH与PHDH是影响两树种叶面积最重要的变量,因此在经营过程中应重视胸径生长,适时抚育间伐为林分创造良好的生长环境,缓和林分中的资源竞争,防止林分过度拥挤,影响胸径生长。
树冠是树木进行光合作用的关键部位,准确估计叶面积模型有助于深入开展树木的生长发育、树冠结构和森林生态系统碳循环等多方面的研究。混交林的单木叶面积模型在一定程度上反映了林木的遗传特性和对宏观环境的响应,但无法具体反映混交对特定位置林木的影响。通过对林木冠层结构的研究,这些方面才能得以体现。为了更深入地了解林木冠层结构,仍需研究叶面积的垂直分布。叶面积的垂直分布是树冠结构的基本组成部分,它深刻地影响着树干横截面的生长、树冠内光辐射的分配、边材液流的辐射格局以及树冠自然摆动频率。以叶面积为基础,进一步研究长白落叶松-水曲柳混交林的叶面积垂直分布,有助于更深刻地了解该混交林的树冠结构,并为人工整枝、林分密度控制等营林措施提供指导。
内容、音频、图片等来源:论文作者
责任编辑:李燕文
微信制作:夏婷婷
如何获取原文?
1.更多精彩敬扫描图片上方二维码请关注南林学报微信公众号、微博号、抖音号、喜马拉雅号、今日头条号
2.扫描下方二维码进入微信的博看网页面
3.原文链接请见于下方二维码