本指南旨在为分析生物多样性-生态系统功能实验数据的生态学家提供实际帮助。与其他方法不同的是,我们使用基于最小二乘法的线性模型(LMs)和基于限制性最大似然法的混合模型(MMs)来分析分层数据。以一个原始数据集为例,该数据集包含了在环境光照或遮荫下单一栽培、2物种或4物种混交栽培的幼树的直径和高度。从简单的LM开始,总结了模型拟合的基本特征以及随后的方差分析(ANOVA)显著性检验。在此基础上,我们开发了更复杂的模型。我们使用R统计软件进行模型拟合,并展示LM和MM之间的相似性和互补性。我们还解释了对比的形成,以及在方差分析中使用误差项(LMs)或随机效应项(MMs)来解释分层数据结构。生物多样性实验数据可在整个植物群落(样地,plots)和植物个体层面进行分析。基本的解释项是物种组成,根据具体的生物学假设,物种组成可以以多种方式划分为对比。通常,这些对比表示物种丰富度或特定物种的存在。在方差分析中进行显著性检验时,通常将对比项与解释项的剩余变异进行比较,因为它们是从解释项中“分割”出来的。一旦选定了最终模型,就可以估算参数(如固定效应项的平均值或斜率,误差或随机效应项的方差分量),以显示效应的方向和大小。在本文中,我们为生态学家提供了一份分析生物多样性-生态系统功能(BEF)实验数据的指南。我们发现,一般的教科书或手册往往理论性或技术性太强,无法提供实际帮助。此外,其中一些指南建议采用基于最大似然法的混合模型(MMs)或贝叶斯分析等方法来分析生物多样性-生态系统功能(BEF)实验,但没有充分考虑到分层数据结构的复杂性。如果首先使用基于最小二乘法(LS)的线性模型(LMs)对此类数据进行检验,就可以避免许多陷阱;在线性模型中,必须通过比较方差分析(ANOVA)汇总表中的模型项,明确构建用户指定的生物相关假设检验。我们将重点放在LMs和MMs中的方差分析上,因为它可以灵活地通过对比项来检验此类假设。我们使用一组原始数据作为实际例子,说明我们所讨论的不同步骤,感兴趣的读者可自行进一步开发。这些数据是在BEF-China项目的试点实验中获得的。在该实验中,我们将生物多样性与光照处理相结合,并测量了树木在一段时间内的生长情况,如下所述。在介绍了典型的BEF实验和示例数据集之后,我们将使用单一时间点的样地水平(plot-level)数据子集来介绍具有单一误差项的LMs和方差分析,它们可用于非层次数据集。在此基础上,我们将开发适用于层次数据集的更复杂的多误差项LMs和方差分析。然后,我们将展示如何用MMs分析此类数据集,在MMs中,随机效应项而不是多重误差项反映了层次结构。在“进一步模型开发”部分,我们将重点讨论方差分析中对比的使用,这可能是我们对BEF实验分析提出的最重要建议。在分析个体水平数据时,我们将讨论重复测量分析和非正交性。最后,我们将在“讨论”和最后的表格中列出建议。由于篇幅限制,BEF实验分析的几个方面未能包含在本文中。其中包括模拟研究数据生成机制、数据转换和方差分析中协变量的使用。我们推荐Zuur等(2010)以及Zuur和Ieno(2016)作为生态数据统计分析的部分及其他方面的有用指南。本文中介绍的所有分析均可通过R统计软件(http://www.r-project.org,2016年10月10日,最后访问日期)重复进行。相应的代码和数据本身可在https://github.com/pascal-niklaus/jpe,2016年10月10日,最后访问日期,以及补充数据中找到。生物多样性的丧失,尤其是物种灭绝导致的物种丰富度的丧失,被认为是影响生态系统的全球变化的主要威胁之一。要分析这一威胁,有必要使用实验,首先是因为我们想找出生态系统如何应对未来持续丧失的严重程度,而这一严重程度在现实世界中尚未发生;其次是因为生态系统间生物多样性的自然变异也存在灭绝以外的原因。因此,只有在刻意操纵物种丰富度的情况下,才能将其视为因果解释生物量生产等因变量变化的自变量。此类实验通常称为生物多样性-生态系统功能实验,简称BEF实验。所有BEF实验的特点都是将不同物种(或品种、基因型等)以不同密度组合在实验群落中。这些群落可以通过播种或种植个体等方式合成,也可以从现有群落中移除个体。因此,所有BEF实验的设计空间都可以用每个物种(品种、基因型等)的密度轴来绘制。感兴趣的生态系统功能(如群落生产力)可视为所有物种密度和这些密度之间相应交互项的函数。很明显,如果要填满这个总体设计空间,就会产生非常多的处理方法,即使只有两个物种也是如此。因此,在典型的BEF实验中,使用的是整个设计空间中方便的子集。在最常用的替代设计中,对设计空间的子集进行限制,使所有处理在实验开始时具有相同的个体总密度。因此,只有物种间的混合比会发生变化。这是可取的,因为混合比反映了物种均匀度和物种组成的变化(如果某些物种的密度为零)。虽然一些替代性设计(如“simplex design”)只关注均匀度的变化而不关注物种组成的变化,但在大型BEF实验中使用的大多数设计只关注物种组成的变化。只有极少数BEF试验采用加法设计,即改变物种组成,群落总密度与物种数量成正比,而物种密度在单一栽培和混合栽培中是相同的。不足为奇的是,短期内加性BEF实验显示的物种丰富度效应明显强于替代性BEF实验,但代价是这些效应可能部分是由密度造成的。大多数大型BEF实验都侧重于替代设计,只对物种组成进行操作,原因是在实验过程中,控制物种的存在和缺失要比控制物种密度容易得多。事实上,尽管实验群落通常是以每个物种最初的混合个体数量相等(即最大均匀度)来建立的,但随着时间的推移,由于物种的存活率和无性或有性生殖率不同,往往会产生倾斜的等级-多度分布(rank–abundance distributions)。因此,正如Schmitz等(2013)在一项为期2年的相应草地实验中显示的那样,除了物种组成外,改变总密度和物种均匀度似乎主要会产生短期影响。在初始混合比相等的替代性和加性实验设计空间子集中(在给定的初始密度下要么存在物种,要么不存在物种),还可以根据物种组成的选择进一步划分出大量子集,其中一些子集如补充表S1所示。原则上,所有具有不同物种丰富度水平的BEF实验中的物种组成,都可以通过实验群落构建池中物种存在/不存在的组合来描述。设计的不同之处在于如何减少所有可能的物种组合,以解决具体问题,并以经济的方式实施实验。最初的BEF实验对一个完整的生态系统采用单一的物种灭绝情景;即每个物种丰富度水平由单一但重复的物种组成来代表。在随后进行的草地BEF试验中,每个物种丰富度水平都播种了几种随机选择的不同物种组成,同时改变植物功能群的数量。在所谓的耶拿实验中,物种数量和功能群组成首次独立变化。在同一地点,后来又增加了一项实验,选择反映不同性状变异水平的物种组成。通过这些实验,BEF关系可以超越所调查的特定物种库。最近,BEF实验采用了更系统的物种组成排列方式,例如,确保所有物种出现在所有丰富度水平的群落中,或确保较低丰富度水平的所有物种组成也出现在逐渐较高丰富度水平的物种组成子集中。所有这些设计都在给定的限制条件下使用完整或随机的物种组成子集。然而,也有一些BEF实验是根据非随机的物种灭绝情景特意选择物种组成的,试图模拟更现实的物种灭绝驱动因素,如富营养化。Schmid等(2002)和Bruelheide等(2014)更详细地描述了BEF实验的典型特征。初始混合比相等的BEF实验的优点是,在分析阶段,可将重点放在模拟物种存在与否对生态系统功能的影响上,这也是本文的重点。本节开头提到的使用物种密度的一般方法实际上从未使用过,如果密度效应不是线性的,这种方法可能不合适。例如,LeRoux等(2013)发现,豆科植物对所研究土壤功能的贡献最好通过一个豆科植物存在项和一个豆科植物播种密度附加项来建模,从而调节豆科植物存在的影响。另一种可能性是使用所谓的实现密度和实现丰富度或多样性度量来分析BEF试验。本文将不讨论这个问题,因为我们的重点是设计变量,这样做的原因如下。虽然添加测量变量作为解释性协变量来寻找支撑设计变量效应的潜在机制可能很有用,但这也意味着放弃了操纵实验的优势,转而进行相关观察研究。下面的思想实验可以说明这一点:建立两个实验群落,分别有16种和4种物种。实验结束时,由于16个物种群落中的物种灭绝,所有群落都只有4个物种。然而,初始物种丰富度的影响仍然非常显著,因为16个物种处理中的幸存物种比4个物种处理中没有灭绝的物种更好地形成了4个物种的实现群落。显然,如果用4个物种的实现物种丰富度作为解释变量,这种效应就会被掩盖。这一思想实验也解释了为什么在分析收获量等生态系统功能时会使用物种丰富度等设计变量,即使收获样本中并不包括实验群落的所有物种。BEF-China项目的试点实验旨在比较亚热带森林树种在不同环境条件下的早期生长情况,特别是不同的种内和种间竞争环境。这项研究的更广泛目标是了解物种之间的竞争相互作用,以便日后在BEF-China项目规模更大的长期生物多样性实验(“主要实验”)中解释亚热带森林群落早期建立过程中产生的影响。本次试点实验的特点是使用了三个而非一个物种池,并使用了两种环境(光照和遮荫)。因此,该实验可被视为由六个BEF子实验组成,每个子实验使用不同的物种池或在不同的环境条件下进行。在面积为1×1 m的样地上种植了由16棵幼树组成的实验群落,这些幼树以4×4的网格排列。这些群落由该地区天然林中的12个常见树种组成,分属3个功能组,即常绿针叶树、常绿被子植物和落叶被子植物。我们首先将这12个树种分为三个组(X、Y和Z),每个组都包含常绿和落叶功能组(补充数据中的补充表S2)。在每个群落中,我们设置了所有的单一栽培、2种混交和4种混交,共产生了11种群落组成。由于3个池中的物种没有重叠,因此共有33种不同的物种组成。所有物种组合都在全光照和遮荫(全光照的5%)条件下生长,从而产生了66种处理组合。这些处理组合在4个区块中重复,总共有264个样地,即每个物种池有88个样地(图1)。有7个样地没有正确建立。因此,Y组只有85个样地,Z组只有84个样地。从2009年4月到2010年9月,我们一直在监测树木的生长情况。我们的假设是,平均而言,树木在有4个物种的样地中比有2个物种的样地中生长得更好,在有2个物种的样地中比单一种植的样地中生长得更好。此外,我们还预计,与全光照相比,阴凉处的树木生长速度较慢,生物多样性效应较小。我们通过测量树高和基径(离地面5厘米),对树木的生长情况进行了非破坏性跟踪。为了获得与生产力相关的样地水平生态系统功能测量值,我们对个体水平测量值进行了加总;死亡个体的测量值为零。通常,在开始分析BEF试验时,可以方便地从一个数据子集入手,直观地查看作为生物多样性(通常是物种丰富度)函数的数据。图2显示了种植14个月后从物种池X中收集的所有群落的总基部面积的样地水平数据(n=88)。该图的目测结果表明,每个样地的总基部面积(ba,此处及随后出现的Courier字体表示统计脚本中使用的名称)在光照下比在遮荫下(光照处理)大。此外,几乎没有迹象表明物种丰富度(fdiv,f表示fdiv代表一个水平因子,而不是连续变量)会产生影响,除了含有优势物种Eleocarpus decipiens的样地,随着含有其他物种的数量增加,它们的基部面积倾向于降低(图2中的实心符号)。此外,特别是在单一栽培和2物种混交之间,基部面积的数值存在很大的差异;这可能是由于物种组成(com)和物种组成内的样地(plot)之间的差异造成的。由于在最高多样性水平上只有一种物种组成,因此该水平上的数值差异应该只是由于样地之间的环境差异造成的。图2 物种库X的样地中种植14个月后存活树木的每个样地的基部总面积(包含Elaeocarpus decipiens的样地已填充实心符号;这些具有特别大的总基部面积)为了检验可视化样地水平数据中是否确实存在系统性变化,可以使用LS方法拟合一连串LMs,这些LMs解释了这种系统性变化,从而将非系统性变化降至最低。这种非系统变异可视为随机变异或噪音,是由实验人员无法控制的各种影响因素造成的。分析的目的是找到一个LM,将数据总变异的大部分归结为系统变异,留下少量无法解释的随机变异。统计模型的制定方式是,数据值是系统效应和与特定值相关的残差或误差的线性函数。因此,最简单的模型假定因变量ba只存在测量误差,根本不存在,即平均值为零。然而,更常见的建模过程是从拟合总体均值开始的,这样误差就是数据点与总体均值之间的差值。在这个模型中,无法解释的随机变异是因变量的方差,然后被称为总变异,通过在统计模型中添加项,将其划分为系统变异和(残余)随机变异。在第一项分析中,ba的总变异分为光照和多样性处理导致的系统变异和这些解释因素无法解释的残余随机变异。统计模型可按以下方式表述为LM:baijk = m+ ai + bj + eijk其中,m代表总平均值,ai代表第i种光照处理的效果,bj代表第j种多样性处理的效果,eijk代表baijk与之前拟合效果预测值的误差或偏差,即: eijk = baijk-(m + ai + bj)该LM还有其他公式,例如用第一组(i=1和j=1)的平均值代替总体平均值,但与其写出上述带参数的LM,不如只指定造成系统变异的项更为方便。在统计软件R(http://www.r-project.org)(本文中的所有分析都将使用该软件)中,具体方法如下:如果使用LS方法(R函数aov或lm)对LM1进行拟合,将以最小化残差(residuals)的方式估算项light和fdiv的影响参数。由light和fdiv这两个所谓的“固定效应”项解释的系统变异可与残差一起列于方差分析表中(表1a)。残差代表所谓的“随机效应”项。如果没有其他随机效应项,所有固定效应项都可以用下面解释的方差比与残差进行比较。所有随机变异都包含在残差中的LM或方差分析被称为非分层LM、MM和方差分析,与分层LM、MM和方差分析相反,后者的特点是有多个随机效应项,下文将进一步讨论。表1a的第一栏列出了因变量ba的解释项或“变化源”。我们为ba的总变化增加了一行。第二列(Df)列出了自由度。自由度表示数据集中包含的“独立信息”的数量或模型项所包含的“独立信息”的数量。表1a中的Dfs比解释项规定的不同水平或组数(light为2-1,fdiv为3-1)少一个。虽然Dfs通常比解释项的水平数少一个,但如果解释项所代表的某些效应已被其他项“消除”,则Dfs还可以进一步减小(例如,如果水平组之间的对比,如fdiv中的单一栽培与混合栽培,是首先拟合的--见下文)。表1a中残差的Df是拟合总体均值和解释项后的残差,即88-1-1-2=84。在这里,总体均值是隐式拟合的,但除非特别要求(summary.aov(m, intercept=TRUE)),否则在方差分析输出中是省略的。请注意,在R的输出中,方差分析中的总体均值项称为“截距”。表1a中的第三列包含一个项对观测值与总体均值的平方差总和的贡献平方和(SS)。也就是说,在仅拟合总体均值的初始模型中,总SS与残差的SS相同。方差分析中每增加一行,SS总值就会减少,减少的数量与所增加项的SS值相同。在简单情况下,项的SS也可以看作是项的组均值与总均值的平方差之和,但在所谓非正交项的情况下(见下文),SS就不再成立了。通常情况下,增加一列将SS表示为占总数的百分比(表1a第四列;不属于R的标准输出)是非常有用的,因为这些值可以用作效应大小的度量。此外,由于项是按顺序拟合的,从方差分析表的第一行开始向下移动,因此%SS值代表了多重R2·100%的增量。对于LM1,多重R2为0.294(=(29.0+0.4)/100);换句话说,LM1所解释的系统变异占ba总变异的29.4%。虽然SSs具有可加性,可用于计算效应大小和“解释的”变异,但它们并未对其Dfs(也具有可加性)进行校正。要获得方差,需要用SS除以Dfs。这些均方差(MSs)不再具有可加性(即它们加起来并不等同于总数的MS),列于表1a的第五栏。这些均方差用于推导显著性检验的方差比(表1a第7栏中的F值)。如果第一项解释的方差大于偶然解释的方差,则某项的MS将超过分母项的MS。也就是说,F值>>1表示该项在统计上有显著影响,从而导致计算F值时使用的两个方差之间存在差异。表1a的最后一列提供了显著性检验的P值,该P值基于F值以及用于计算F值的分子和分母MS的Dfs。在P<0.001的情况下,如果没有“true”的效应,则只有在1000次重复实验中有<1次会出现相应的F值。因此,可以拒绝无效应的零假设。在表1a的例子中,光照的显著效应表明ba在光照下比在遮荫处大,而fdiv的不显著效应证实了目测的猜测,即不同水平的fdiv具有相似的ba。事实上,fdiv的F<1甚至表明,平均而言,从不同水平随机选取的两个群落比从同一水平随机选取的两个群落更相似。在非层次方差分析中,残差是唯一的随机效应项,F值的分母总是残差的MS。然而,对于所谓的层次数据,残差的MS并不能为所有待检验项提供正确的分母。为了构建适当的F值,有必要知道MS中包含哪些方差成分(VC),因此,我们在此引入了期望均方差(EMS)这一重要概念,并将其添加到表1a的MS和F值之间的单独一列中。已有研究表明,EMS可视为VCs的线性组合,Snedecor和Cochran(1989)等给出了计算VCs系数的规则。然而,要找出EMS中包含哪些变量,需要对数据有统计学和生物学方面的了解,而且会随着所提问题的不同而变化。残差的EMS只包含一个VC,即σ2res,用于测量模型无法解释的数据中的残差随机方差。每个其他项的EMS等σ2res加上一个VC,该VC解释了组间差异,这里是光照处理之间的差异(σ2light)或多样性处理之间的差异(σ2fdiv)。这些方差分量与反映各处理组重复次数的系数相乘。在组数不等的情况下,一个好的近似值是它们的调和平均值。对fdiv而言,即16.94=3/(1/(4×8)+1/(6×8)+1/8),其中主变量中的不同分量表示单一栽培(4×8=4个物种×2个光照水平×4个区块)、2种混合栽培(6×8=6个2种组成×2个光照水平×4个区块)和4种混合栽培(8=1种组成×2个光照水平×4个区块)的重复数。根据表1a中的EMS方程,可以清楚地看出,F值的计算方式总是使要比较的两个方差只有一个VC不同。因此,F>1表示分子EMS中的附加变异系数>0。例子中fdiv的F<1显示了一个重要的特殊情况,即σ2fdiv的相应估计值为负值(表1b)。F<1的值总是表示负的VC。虽然方差从来都不是负值,但作为方差组成部分的VC不一定要限制为正值。然而,在使用最大似然法(ML)或限制/残差最大似然法(REML)的多变量模型中,负的变异系数通常是不允许的,因此在拟合过程中被限制为零或很小的正值。这可能是危险的,因为负的VC可能表明分母中的EMS包含的VC比EMS中指定的要多,即残余“噪声”不仅仅是随机的,还包含系统成分或相关数据。当模型中未包含的解释项对残差的MS有贡献而对测试项的MS无贡献时,通常会发现负的VC。(例如,在分层试验的分层数据方差分析中,当LM或MM中省略了分层处理时,通常会出现这种情况)。如果不这样做(这在MM中尤为诱人),可能会导致F检验过于宽松(见下文:“个体水平数据和重复测量分析”一节)。除了指导方差分析中显著性检验F值的适当构建外,VC也可作为%SS的替代方法,用于衡量解释项的效应大小。与%SSs相比,这种方法更重视Dfs较少的解释项;因此,用VCs衡量时,光照的影响几乎与残差的影响一样大,但用SSs衡量时,光照的影响还不到残差的一半(表1)。LM1的方差分析表包含SS、MS、F值、P值和VC的信息。拟合LM的另一个目的是获得参数估计值,在本例中,参数估计值是组间均值及其标准误或组间差及其标准误。由于这些估计值反映了拟合模型以及由此得出的显著性检验,因此与原始数据计算出的均值和标准误相比,这些估计值通常更受青睐。在正交处理模型中,LS均值等于原始均值。然而,模型拟合过程中计算出的标准误差通常不同于直接从数据中计算出的标准误差,因为模型假定所有测量值的真实变异是相同的,因此估计值的标准误差可以从残差的标准差中计算出来,残差的标准差是残差MS的平方根或s。组均值的标准误差等于s/√n,其中n是该组中的数据点数。如果两个组的规模相同,那么它们之间差异的标准误差就是组均值的标准误差乘以√2。参数估计可以通过R函数summary.lm获得。如何结合估计参数来描述建模数据,取决于如何构建这些参数与数据相关的模型矩阵。默认情况下,aov使用所谓的“处理对比”,其中第一组(按字母顺序排列)作为截距;附加参数将其他组的平均值估算为与第一组的差异(使用哪种对比编码可通过options(contrasts=…)进行更改)。使用带有多个误差项的LM和方差分析(层次模型)分析样地水平数据上述LM1不包含不同物种组成(com)项,因此相关方差包含在残差中。如果将com包括在内,就会形成一个具有多个随机效应或误差项的分层统计模型。如果将此类模型作为LMs进行分析,则应将误差项集合到所谓的误差模型中:ba ~ com + light × com + plot该模型是全面的,因为它拟合了11个com水平中每个水平的平均值、22种light × com组合中每种组合的平均值(2种光照处理与11种物种组合的交互作用模型)以及88块样地中每块样地的平均值。拟合该模型不会产生残差,因为这些残差完全被样地一项所捕获。因此,要进行显著性检验(F值和P值),必须省略样地:ba ~ com + light × com (LM2)请注意,残差现在只有Df=66(表2a),因为Df=10已经被com占用,Df=11被light × com占用(如果省略com,light × com的Df=21)。在方差分析(表2a)中,这两个解释项被视为固定效应项,并“针对”残差进行检验。对于com而言,这种方法并不合适,因为其EMS比残差多了两个VC。因此,尚不清楚com的显著性是否意味着VCcom或VClight×com或两者都>0。用MScom除以MSlight × com可以得到com的校正F值。误差模型LM2包括之前由LM1解释的系统变化,也称为处理模型。这是因为fdiv包含在com中,而light包含在light × com中(light × com也是如此,但我们暂不考虑)。在这里,处理模型的项代表固定效应对比,可以从误差模型的相应项中“分割”出来。请注意,这些误差项与下文进一步讨论的MM中的随机效应项相对应。使用LMs分析分层数据需要将处理模型和误差模型(即分别为LM1和LM2)合并到一个新的LM3中,其中所有项都要按顺序拟合,确保对比总是先于从中分割出来的项拟合:ba ~ light + fdiv + com + light × com (LM3)根据方差分析中插入的EMS(表2c),可以计算出解释项的VC(表2d)。比较表2b和d中的VCs可以发现,在LM3中,VClight×com下降了,因为它不再包含光照的巨大固定效应。相反,VCcom增加了,因为用于计算VCcom的MSlight×com从297降至45(分别见表2a和c)。尽管MSfdiv现在略大于MSres,但VCfdiv仍为负值(表2c)。然而,为了构建适当的显著性检验,必须计算F值和P值,分母中的误差项与被检验项只相差一个VC。这些校正后的F值用于检验各变量是否>0(表2c):Flight=MSlight/MSlight×com,Ffdiv=MSfdiv/MScom,Fcom=MScom/MSlight×com。表2c中新的方差分析证实,全光照样地中的ba明显大于遮荫样地(光照),三个多样性水平之间的差异在统计上不显著(fdiv)。然而,多样性水平内的特定物种组成之间存在显著差异(com的显著效应),而多样性水平之间的差异则是在此效应的基础上检验的,而且特定物种组成之间对遮荫的反应也存在显著差异(交互作用light×com)。与所有的双向交互作用一样,这种显著的交互作用也可以从生物学角度进行第二种解释,即在完全光照和遮荫条件下,物种组成之间的差异并不相同。固定效应项fdiv应与多样性水平内物种组成之间的剩余差异(com出现在模型公式中fdiv之后)进行检验,这是BEF实验分析中的一个特殊之处。从生物学角度来看,这样做是合理的,因为物种丰富度是群落特定组成的一种属性,即群落组成是物种丰富度的复制单位,因此在方差分析中代表了一个额外的层次。因此,相同组成的样地之间的差异反映了与“产生”物种丰富度的因素无关的差异。真正的物种丰富度效应表现为随机选择的两个不同物种丰富度等级的物种组成之间的差异平均大于随机选择的两个单一等级的物种组成之间的差异。如果我们将fdiv视为固定效应项,将com视为误差项,或者用MM项,将其视为随机效应项,那么从统计学角度看,这是有道理的。在这种情况下,根据Snedecor和Cochran(1989)的规则,固定效应项包括嵌套在其内的所有随机效应项的VC,即fdiv的EMS包括σ2com(表2c)。com项嵌套在fdiv中,在R中可以用嵌套运算符“/”来简短表示:fdiv/com ⇔ fdiv + fdiv:com不过,由于com在fdiv的各个层级中都有不同的编码值,因此下列公式是等价的:fdiv/com ⇔ fdiv + fdiv:com ⇔ fdiv + com如果com被视为固定效应项,那么fdiv的EMS将不包括VCcom,因此在F检验中,MSfdiv不应与MScom进行比较。我们将在下一节进一步阐述这一点。对于一个项应归属于处理模型还是误差模型,或者用MM的项来说,一个项应被视为固定效应项还是随机效应项,并没有严格的规定。有时,两者都有合理的理由。例如,如果多样性效应的推断是针对一个更大的统计群体,如从一个区域物种库中可能组合出的所有可能的物种组成,那么在LMs或MMs中,其水平代表随机样本的相应项com就需要分别被视为误差项或随机效应项,com被用作fdiv的复制单位。另一方面,如果多样性效应的推论仅限于所调查的特定物种组成,则com可作为固定效应项处理,残差(=plot)可作为fdiv的复制单位。然而,在第二种情况下,推论不能超出所调查的物种组成集。对于固定效应项,我们感兴趣的是单个组的平均值(如单一栽培、2物种混合栽培和4物种混合栽培)或它们之间的差异(如光照与遮荫平均值之间的差异)。然而,对于误差或随机效应项,我们感兴趣的是变异系数,因为我们认为不同水平或不同组别是从更多可能被选中的组别中随机抽取的样本,我们关注的是它们的变异程度,而不是具体水平。Green和Tukey(1960)提供了一个简单的经验法则:固定效应项的水平代表“少数中的全部”,误差或随机效应项的水平代表“多数中的少数”,其中第二个“少数”大于第一个“少数”。对于具有多个误差项的方差分析模型,基本的aov(和lm)函数有其局限性,因为默认情况下,所有解释性固定效应项都是针对残差(唯一的随机效应项)进行检验的。如上所示,我们可以计算VC(通常分配给随机效应项的项目),并“手动”计算多个误差层的适当F值。通常,方差分析表中不会显示误差或随机效应项的F值,因为这些项的VC>0的显著性并不重要(但请注意前面提到的Hector等(2011)将其用作效应大小的衡量标准)。尽管如此,我们建议将随机效应项与固定效应项同样列出,或如表1和表2所示,在表格的第二部分列出其VC。首先,这可以让其他人检查模型中包含了哪些误差项或随机效应项,以及它们对层次结构的贡献程度。其次,这些项可能具有生物学意义,例如在com的情况下,显著的正VC可以解释为物种组成之间的显著差异。因此,可以从com中进一步寻找固定效应对比,例如实验群落中特定物种存在与不存在的对比(见下文)。通过扩展aov中的模型公式语法,可以在Error(...)中添加多个误差层:aov (ba ~ light + fdiv + Error(com + light : com)我们也可以写+Error(com/light),扩展为Error(com+light:com)。函数摘要会为每个误差层生成单独的方差分析表;这是LM方差分析表推导方法的一个非常强大的方面。这种方法的一个特点是,如果固定效应项与误差层不正交(例如,由于缺失值,见下文),则会在多个误差层中进行测试。这些多重检验将消耗额外的Dfs,如果相应分层中没有足够的Dfs,就会导致检验失败。在LMs中,所有VCs都是通过估计每一级解释项的参数来计算的,而在MMs中,随机效应项的VCs是通过基于ML的方法从数据中直接估计出来的。这在计算上要快得多,因为每个项只需估计一个参数,而不是许多参数。当然,随后使用方差分析进行显著性检验时,仍需考虑到随机效应项存在多个水平,因此需要对Dfs进行相应调整,这被称为REML方法。由于MMs以不同方式估计不同解释项的影响,即对固定效应项估计多个参数(每个水平一个),对随机效应项估计单个方差参数,因此被称为MMs。它们的缺点是无法计算随机效应项对总SS的贡献,因此无法以与固定效应项相同的方式在综合方差分析表中列出。不过,MMs的一个优点是,直接估计随机效应项的方差自然会考虑到不同组别样本量不等的情况。此外,在MMs中,带有固定效应项的处理模型可以与带有随机效应项的误差模型分开书写,因此拟合顺序只对固定效应项有影响。在R中,可以使用函数lme(nlme包)或lmer(lme4包)来拟合MMs:lme(ba ~ light + fdiv, random = -1|com/light) 或lmer(ba ~ light + fdiv + 1|com/light) (MM3)方差分析表可通过应用anova函数获得,但在lmer中,只有先加载R包lmerTest才能生成P值(表3a)。VC(在lme中为相应的标准偏差,即√VC)通过应用函数summary得出。上述MM与LM3适合相同的统计模型,但由于参数估计方法不同,结果并不完全相同(比较表2c和d与表3a)。此外,lme和lmer不允许VC<0,因此它们的估计值为零或接近零。幸运的是,MM3中不存在这种情况,因为固定效应项不计算VC。然而,这个问题需要特别注意,因为VCs“约束”为零表明模型隐含的方差结构不适合数据,这可能导致显著性检验过于宽松或过于保守,这取决于所考虑的层次水平。只有找到一个更好的模型,所有的方差结构都不受约束,而且所有的固定效应项都有相应的随机效应项,才能检测出检验结果是过于宽松还是过于保守。例如,在LM3(现已被MM3取代)的情况下,要对固定效应项fdiv进行正确检验,就必须包含随机效应项com,因为fdiv是com的对比项。因此,如果com受约束,则必须继续建模,直到消除这种“约束”。如果做不到这一点,可以使用特殊函数,如asreml(由商用ASReml提供),它不会将方差分量限制为正值(见下文示例和表5b中所示)。另一种解决方案是使用LM而不是MM方法。相比之下,MM方法的优点不仅在于能更好地处理不平等的分组大小,而且固定效应参数估计的标准误差(表3b)也会根据随机效应项所指定的数据层次结构进行校正。此外,MMs通常比LMs更容易指定,但这有时也是一个缺点,因为指定一个不合适的MMs也比指定一个不合适的LMs更容易。最后,LM通常更容易在R中拟合,因为它们使用的是LS而不是ML/REML方法。因此,我们建议在开始分析BEF实验的分层数据时先使用LM,在确定了导致因变量变化的相关解释项后再使用MM。除了LS和ML/REML方法外,层次模型还可以用贝叶斯方法拟合。我们在补充附录S3中对此进行了演示。贝叶斯方法可以直接估算固定效应项的参数和随机效应项的VCs,以及尊重数据层次结构的可信区间(CrI)(如果正确指定的话)。可以用可信区间代替P值来检查参数估计或VC是否偏离零。在贝叶斯分析中,通常用有向无环图(图3a)来指定模型。类似的图形也可用于开发LM和MM(图3b);我们将在图4中提供更多相关示例。图形表示法有助于更好地理解复杂的模型,因为它们可以直观地显示对比的层次结构,而这种结构可以从一个完整的模型开始,为每个单独的数据点指定一个平均值(见下文)。图3 (a)用贝叶斯方法分析图2示例数据的有向无环图;(b)简化图显示了与(a)相同的模型结构图4 用图3b中介绍的方法继续对图2中的示例数据进行模型开发。(a)-(c)是具有相同残差方差的模型,但显示了两个随机项(斜体)形成对比的不同方法方差分析的基本概念是分割方差,更确切地说,是分割SS。在上文物种池X的样地水平数据示例中,Df=87的总SS可分为Df=21的SS(light × com的22种组合)和Df=66的SS(残差)。前者还可以以多种可能的方式进一步分割成对比,最极端的情况是分割成21个Df=1的对比。精心选择的Df=1的对比尤其有用,因为它们能进行有重点的比较,并检验最合理的假设。一旦建立了对比列表并对其进行了方便的编码,那些Df较大且被视为随机效应项的对比就可以移到误差模型中。因此,建立模型的过程可以非常灵活,包括在拆分过程走得太远,导致过多的项只能解释很小的变异(%SS)之后,再次合并SS。BEF实验的典型特征是,在拆分过程中,固定效应项可以作为随机效应项的对比项被分割出来,也就是说,“SS-material”可以从误差模型转移到处理模型,或者换句话说,随机变异可以转移到系统变异,这是所有统计建模的主要目标。然而,相反的情况也是可能的,即在合并SS的过程中,固定效应项被省略,从而与随机效应项(包括残差)合并,并从处理模型移至误差模型,换句话说,系统变异被移回随机变异。物种组成的典型对比可以解决BEF实验中的重要生物学问题(图4)。这些实验通常还包括阻断项;阻断项通常与处理相关的解释项无关,即完全正交,其作用只是减少残差。在图4所示的例子中,模型中首先拟合了区块,以消除其对其他项所解释的变异的潜在贡献;如果失去了正交性,例如由于缺失值,就会出现这种情况。下文将进一步详细讨论非正交性问题。简而言之,当两个固定效应项A和B依次拟合且相互关联(非正交)时,SSA将包含来自B的贡献,而SSB将不包含来自A的任何贡献,因为这些贡献已被解释。因此,A的拟合“忽略”了B,而B的拟合“消除”了A。由于人们通常对区块间的变异不感兴趣,因此在拟合过程中忽略区块中可能包含的后继项所带来的变异并不重要。然而,至关重要的是这些后继项不包含区块间变化的贡献,因此先拟合区块可以消除这些变化。在MMs中,与区块相关的项可以作为固定效应项或随机效应项进行拟合。我们通常倾向于将其拟合为固定效应项,因为:(i)它们的数量通常太少,无法可靠地估计方差分量;(ii)区块通常不符合具有正态分布效应的随机样本的要求,因为它们通常以线性序列系统地排列。事实上,对线性或二次空间梯度等区块项进行对比甚至是有用的,尤其是当这些区块项可以解释区块项中包含的大量变异时。对于对比度,关键是要考虑拟合项的顺序。如果将图4c的模型拟合为LM4(表4a)或MM4(表4b),则在剔除基部面积最大的物种Elaeocarpus decipiens(ed)后,多样性项fdiv的线性对比(div)变得显著。现在,有E. decipiens的样地和没有E. decipiens的样地的线性多样性效应的共同斜率是负的,表明随着多样性的增加,E.
decipiens密度的减少导致ba的减少(图2)。从com中划分出来的固定效应对比ed和div与光照处理的交互作用也很显著,这支持了生物多样性效应(包括物种存在效应)在光照下比在遮荫处更强的预期(见图2)。由于生物多样性(B)和生态系统功能(EF)分别在样地水平进行操作和测量,因此BEF实验的典型统计分析使用水平层面的数据。不过,对物种甚至个体的测量数据进行分析也很有意义。个体层面的数据分析遵循与样地层面数据分析相同的原则,但由于多了一个层次,数据结构会更加复杂。特别是,解释项现在不仅在不同样地之间存在差异,在样地内部也可能存在差异。综合分析的统计模型可以写成只包含误差项(LM)或随机效应项(MM)的误差模型:uind项指的是257个样地×16棵树=4112棵不同的树木个体,ftime指的是测量所有树木个体高度(y)的17个时间点(种植后的月份)。由于有几棵树在实验过程中死亡,而且区块4中的树在14个月后被采伐,因此在4112棵树×17个日期(完整设计的n=69904)的总数中,约有三分之一的数据缺失,这个问题将在下文讨论(见“个体水平数据和非正交性”部分)。需要注意的是,上述模型将因子ftime的17个水平视为从许多可能的时间点中随机选择的,尽管它们实际上是有序和等间距的。下面,我们首先分析所有个体随时间变化的树高(如图5所示),以介绍重复测量分析的方法。解决这一问题的方法之一是分析单个时间点的数据;下面将进一步讨论前面提到的非正交性问题。图5 在17个月的实验期间,4089个个体的茎干高度(厘米)。每个池中有四个物种。有几棵树在实验期间死亡,第4区块的所有树木都在第14个月后被采伐。时间1为2009年5月,时间17为2010年9月。上述误差模型为每个观测值都拟合了一个单独的值,没有任何变化可作为残差进行估算。利用上一节解释的原理,可以将uind项划分为多个项,以反映数据集的层次结构。精简后可写成y ~ (com + light:com + plot + uind) *ftimey ~ com + light:com + plot + uind + ftime +com:ftime
+ light:com:ftime + plot:ftime + uind:ftime请注意,在综合公式(y~uind*ftime)中,uind是作为合计项来拟合的,但在上述公式中,uind是在前三个项(com + light:com + plot)从中分离出来后拟合的。因此,uind只能解释个体间的其余变异,而前面三个项的变异已被剔除。除去uind:ftime项(相当于残差),模型MM5可用lmer拟合:lmer (y~(1|com) + (1|light:com) + (1|plot) +
(1|uind) + (1|ftime) + (1|com:ftime) + (1|light:com:ftime) + (1|plot:ftime) (MM5)拟合MM5可能需要几分钟,再次应用汇总或anova方法可能也需要几分钟。然而,在目前大多数台式机或笔记本电脑上,用aov拟合LM5模型是不可能的,因为超过4000级的uind和超过4000级的plot:ftime会导致非常大的模型矩阵。因此,这个例子说明了在分析分层数据时,MMs相对于LMs的主要优势之一。为了建立处理模型,现在可以从MM5中以特定的方式划分出固定效应对比,以检验生物学上的假设。上一节介绍的这一过程也许是BEF实验分析中最困难、但也是最具创造性的一步。此外,没有加快这一过程的简便方法,也不宜使用纯粹基于统计考虑的自动模型选择程序。在此,我们仅介绍一个具有生物学意义的模型(我们鼓励读者尝试更多的模型):lmer (y ~ block + light +
div + sp + light:div + light:sp + div:sp + time + light:time + div:time +
sp:time + (1|plot) + (1|light:com:sp) + (time|com) + (time|light:com) + (time|com:sp) (MM6)在MM6的方差分析中(表5a),时间是因子ftime的线性对比,可用来检验在17个月的实验中植物的高度增长是否具有显著的线性斜率,根据图5,情况似乎大致如此。sp指的是12种树木个体,是从uind中划分出来的固定对比。不过,这也有一点小麻烦,因为在单一种植样地中,所有植物都属于同一物种,在这种情况下,sp也可以被视为从com中划分出来的固定效应对比。要解决这个问题,可以为物种建立两个单独的对比,一个称为monosp(指单一栽培中的物种),另一个称为mixsp(指混合栽培中的物种)。然而,这样一来,div × mixsp的交互作用只涉及2种和4种群落之间的差异,因为monosp可以完全解释单一栽培物之间的成分差异。然而,MM6并不完美,因为物种效应很可能包含σ2com和σ2plot的“污染”。因此,对物种项及其相互作用的检验往往过于宽松,因此应谨慎解释。遗憾的是,MM6难以用lmer拟合(表5a)。不仅运行时间很长,而且lmer也不能保持固定效应项的顺序,而是将交互作用移到主效应之后,即使这些交互作用是不相关的。此外,lmer将MM6中的两个方差分量限制为零,如前所述,这可能会造成问题。因此,我们在表5b中列出了使用asreml.nvc函数(使用市售R软件ASReml)对MM6所做的方差分析。通过这种分析,对固定效应项light和div的检验现在是显著的,因为它们可以分别与适当的随机效应项light × com和com进行比较。这反映了所有多变量模型都必须考虑的一个重要因素:对于每个固定效应项(上式的前三行),都必须指定适当的随机效应项(上式的后两行)并对其进行估计,以定义正确的误差层。表5b显示了固定效应项和随机效应项之间的匹配情况(另见表4a)。不过,需要注意的是,有时一个固定效应项可以被视为从多个随机效应项中划分出来的一个对比项,即这些随机效应项的线性组合,如上一段就sp的情况所解释的那样。此外,需要注意的是,在上述模型公式中,(time|com)表示com和com × time,(time|light:com)表示light × com和light × com×
time,(time|com:sp)表示com×sp和com × sp × time。根据表5b中的方差分析,我们可以得出结论:示例中样地内的个体植株高度受到样地水平解释项光照和线性物种丰富度(div)以及个体水平解释项物种(sp)及其与光照(light × sp)和div(div × sp)的交互作用的显著影响。由于所有这些个体间差异都可以用不涉及时间的随机效应项进行比较(见表5b),因此相应的检验不会受到个体内部随时间变化的潜在自相关性的影响。此外,将线性对比时间从ftime中分离出来,可以用适当的随机效应项比较身高增长的线性斜率,这些随机效应项不包含ftime,因此仍然不受潜在自相关的影响(表5b)。这里的生物学解释是,个体显示出显著的线性株高增长(time),但个体的线性株高增长受到光照(light × time)的显著影响,而且不同物种之间存在差异(spec × time)。使用时间的线性或多项式对比是解决具有潜在时间自相关性的重复测量问题的有效方法。另一种方法是分两步进行:第一步,计算每个个体的株高与时间的线性回归斜率。在第二步中,可以使用LMs和MMs将单个斜率作为元数据进行分析,而不再涉及时间。此外,还可以使用非线性生长函数(如逻辑生长),否则很难做到这一点。我们在补充附录S4中展示了这种分析方法。不过,为了更深入地了解重复测量数据的系统变异模式,通常需要分别分析不同测量时间的数据,下一节将对此进行说明。由于只关注一个时间点,即种植14个月后的个体植株高度,先前的MM6模型可以更容易地扩展,以提出更多的生物学问题,特别是样地水平的优势物种Eleocarpus decipiens(ed)、Dalbergia hupeana(dh)和Sapindus mukorossi(sm)的存在对比是否可以解释物种组成(com)之间个体高度的巨大差异,以及光照引起的线性物种丰富度效应差异在不同物种之间是否存在差异(三向交互作用light × div × sp)。正如前面所建议的,我们在这里使用LMs得出方差分析结果,因为与使用MMs相比,LMs可以更灵活地进行模型拟合,保留固定效应项的拟合序列(函数项的keep.order=TRUE选项),并将其与误差项(MMs中的随机效应项)以相同的“货币”(即SSs)进行比较。使用不同的拟合序列可以显示BEF实验数据中非正交性的影响,以及这与相关生物假设检验的关系。以下模型aov(terms (y ~ block + light + ed + dh + sm + div +
sp + light:ed + light:dh + light:sm + light:div + light:sp + div:sp +
light:div:sp + com + light:com + plot + com:sp + light:com:sp, keep.order =
TRUE)) (LM7)aov (terms (y ~ block + light + div + ed + dh + sm
+ sp + light:div + light:ed + light:dh + light:sm + light:sp + div:sp +
light:div:sp + com + light:com + plot + com:sp + light:com:sp, keep.order =
TRUE)) (LM8)具有相同的残差,但其他项的Dfs和SS随其在模型和方差分析表中的位置而变化(补充表S5a和b)。样地中三个优势物种中任何一个的存在都会对个体水平的树高产生非常大的影响,这并不奇怪,因为这些优势物种被包括在这些树木中,其他物种也可能在与它们的竞争中长得更高,以获得光照。然而,light × div × sp的三方交互作用并不显著,也就是说,光照引起的线性物种丰富度效应差异在不同物种之间似乎并不存在差异。LM7和LM8中不同的拟合序列会导致不同的结果,因为所涉及的项不是正交的,即不是独立的。在本案例中,非正交性是设计本身固有的,因为例如不可能有包含X池中四个物种但排除E. decipiens的样地。此外,数据缺失也会造成非正交性,因为缺失数据在处理组合中的分布不成正比。一般来说,协变量也会导致非正交性,因为这些协变量几乎从不与模型中的其他解释项正交。虽然根据LM7和LM8得出的方差分析表使用的F值和P值是基于LS方法计算出的误差项,因此可能不如使用REML方法从MMs得出的方差分析表完美,但这些方差分析表可以很好地说明按顺序拟合的不同解释项的重要性,因为所有解释项的效应大小都可以通过%SSs进行检验。这可以衡量添加一个项后,整体模型拟合度(即多重R2)的改善程度。根据模型拟合预测数据也可以显示效应大小。许多R类都提供了预测方法,可用于此目的。不过,要根据项在模型中的位置来解释其效应大小,最稳妥的方法是拟合一个简化模型,该模型包括所有项,直到感兴趣的项,然后再查看该项的参数估计。因此,对于div:summary.1m (aov (y ~ block + light + ed + dh + sm +
div))由此估计,每增加一个样地中的物种,其高度变化为-11.8 cm。这是因为,对于有优势物种的样地,物种丰富度的增加意味着每块样地优势物种个体的减少。如果在优势物种之前拟合div项,其影响要小得多(补充表S5b),但summary.lm (aov (y ~ block + light + div))每增加一个样地中的物种,其高度就会增加1.64 cm。这表明,忽略样地中优势物种的存在会导致多样性产生轻微的正效应。从技术上讲,这些对div的估计值等同于所谓的I型(序列)方差分析中的相应假设检验,也就是本文中使用的方差分析类型。如果在模型中加入所有项(包括方差分析中出现在相关项之后的项)后再估计参数,则上述假设不成立。那么,在拟合序列中,该相关项也会对其后面的项进行调整。换句话说,所有项都会根据模型中的所有其他项进行调整,拟合序列的所有信息都会丢失。这种参数估计不再符合方差分析表中通过F值和P值检验的生物学假设,因此会产生很大的误导。甚至可能会改变效应的方向,例如在上述第二个模型中,如果在div之后加上三个优势物种的对比,就会出现div的效应。在模型中加入所有项后得到的参数估计与所谓的第三类(非序列)方差分析中的假设检验相对应。第三类方差分析是由尽可能多的分析组合而成的,以允许每个项按顺序最后出现一次,然后提取相应的SS。这可能会导致生物学意义不大的拙劣假设。如果非正交性很强,情况尤其如此;对于正交数据,I型和III型方差分析是相同的。我们的分析到此结束,我们强调,对于来自BEF实验的数据(如本文所展示的数据),存在着大量进一步建模的可能性和影响,在得出相关生物学假说的结论之前,应该对这些可能性和影响进行广泛的探索。这里的一个关键工具是将解释项分解为对比项。在最极端的情况下,对于一个有k个层次的解释项来说,k-1个单一Df对比可以以多种不同的方式形成,就像一棵树上的k个树枝可以通过k-1个单一分支事件以多种不同的方式连接起来一样。分析的目的是找到能解决有趣的生物学问题的对比。这些对比可能是多样性或时间的线性对比,也可能是有或没有特定物种的群落之间的对比,还可能是属于特定功能群或具有特定系统发育关系的物种之间的对比。由于存在许多潜在的分析方法,复杂实验设计的方差分析既是一种探索工具,也是一种确证工具。不过,与观察性研究数据相比,BEF实验数据的优势在于,它们可以在先验假定因果关系的情况下进行分析,因为解释项已经被实验者操纵过,可以被视为固定效应项。这也意味着模型比较可以基于生物学判断,而不需要AIC类信息标准等工具。本节最后的“问题与答案”见表6。
表6 生态学家分析BEF实验的常见问题和建议的答案
基于LM的方差分析和基于MM的方差分析在分析BEF实验的复杂层次数据时分别有哪些优势?基于LM的方差分析非常灵活,可以使用SS比较固定效应项对系统变异的贡献和误差项对因变量随机变异的贡献。负VC不限制为零。除非误差项有非常多的水平,否则LM可以非常有效地拟合。基于MM的混合模型能更有效地估计方差分量,并能直接检验固定效应项,而且在非正交项的不平衡数据集中,能更准确地检验固定效应项。然而,MM有时可能无法收敛,如果VC被限制为零,检验的准确性就会降低。对于具有有序水平的因子F,可以通过使用连续变量x、log(x)、x+x2+...来指定线性、对数线性或多项式对比。为了将特定处理水平与其他处理水平(如单一栽培与混合栽培)进行比较,可以指定对比,给每组处理贴上不同的标签。在对比之后必须拟合子对比,例如,单一栽培与混合栽培后的x(物种丰富度)将仅检验混合栽培中物种丰富度的线性效应。要对固定效应项进行正确检验,MM中必须包含哪些随机效应项?所有定义误差层并因此定义处理复制水平的项都必须作为随机效应项在MM中指定。在测试固定效应项的交互作用时,这一点尤为重要。例如,当固定效应项F1(如div)需要随机效应项R1(如com)时,固定效应交互作用F1×F2(如div:light)需要交互作用R1×F2(如com:light)作为随机效应项。是的,对于固定效应项而言;在构建方差分析表时,会按顺序添加项,并通过比较嵌套模型来构建检验。从这个意义上说,在模型中较早加入的项会消除可由较晚加入的项解释的变异。对于MM中的随机效应项来说,顺序并不重要,但在LM中,误差项必须紧跟在从中划分出来的固定效应项之后,而且误差项的顺序必须尊重分层数据结构(从较高误差层到较低误差层)。检查统计模型中是否有遗漏项,这些遗漏项可能会影响F值的分母而不影响分母项。这种情况通常发生在主样地项上,而分样地项被省略。在其他情况下,当误差项受到负自相关的影响(如由于竞争)时也会出现这种情况。在这种情况下,应允许负方差成分提供适当的误差项。或者,也可以在统计模型中指定自相关和其他方差结构(本文不讨论)。统计模型应遵循设计还是根据AIC或BIC等模型选择标准来选择?在实验研究中,统计模型应包括所有先验假设的项,并对其进行实验操作(如light、div、com)。F值较小的项可以集中起来,或包含在误差项(LMs)或随机效应项(MMs)中。最好使用单个项的F值,然后使用评估整个模型的标准(R2、AIC、BIC)。后者更适用于观察性研究。参数估计及其标准误差能否用于检验方差分析中解释项的显著性?在数据平衡和项正交的情况下,可以对单Df项进行检验(那么从估计值的标准误差得出的t值就是该项F值的平方根)。在其他情况下,不建议这样做。参数估计总是针对完整模型(即剔除所有其他项)计算的,因此可能无法反映方差分析中用于解决特定生物学假设的项的顺序拟合序列。在实验研究中,统计分析应在没有协变量的情况下开始。通常,协变量会破坏实验设计的平衡性和正交性。它们还会改变效应的解释,而效应将根据协变量进行调整。如果在分析后期引入协变量,它们可能会解释效应,例如将显著效应变为不显著效应。只分析数据集的特定部分通常很方便,例如来自单一时间点或特定物种集的数据。但是,如果进行多次单独分析,就会出现多重检验的问题。因此,还应始终进行综合分析。此外,如果对于同一数据的两个子集,一个项在一项分析中显著,而在另一项分析中不显著,这并不意味着该项的影响在两个子集之间存在显著差异。这只能通过该项与综合分析中定义子集的项之间相应的交互作用来检验。
基于LM的方差分析指的是R函数aov和lm中使用的方法,即线性模型。基于MM的方差分析指的是R函数lme、lmer和asreml中使用的方法,即混合模型。上述介绍旨在展示生态学家分析具有典型复杂层次数据结构的BEF实验的方法。BEF实验旨在寻找生物多样性对生态系统功能的一般影响,但同时也承认,这些一般影响的产生只能是因为不同物种(或功能群、基因型等)对因变量具有或多或少相似的主要影响和交互影响。因此,BEF实验必须包括k>>1种不同的物种组成(基因型组成等)作为处理,这就自动导致了在一次分析中检验k-1个正交假说以及在不同分析中检验更多假说的可能性。如果还需要测试影响因素(例如不同的光照水平或不同的时间点),那么可能的假设数量还会进一步增加。从概念上讲,BEF实验的复杂性可以从两方面着手:要么从测试最重要的固定效应项入手,忽略其他所有项(方法1,以LM1为例);要么从最具包容性的随机效应项入手,为每个观测值提供预测值(方法2,以MM5拟合前使用的方程y ~ uind*ftime为例)。此外,还可以分别探索完整数据集的不同子集,但在稍后阶段,这些子集必须再次合并。否则,并非所有感兴趣的假设都能得到检验,而且不同子集得到的检验结果可能是相互依赖的,例如,如果对不同的时间点分别进行分析。我们建议采用所有这些方法,以充分了解数据中的系统性和层次性随机变异。此外,在拟合统计模型和制作方差分析表的同时,根据解释项的不同等级分组来制表和绘制数据图总是很有帮助的。对于方法1和方法2,使用图3和图4所示的图表可以方便地在不同模型之间移动。使用方法1时,在图表中添加新的方框,这些方框在以前版本的图表中被忽略(即包含在残余随机变异中)。在方法2中,新方框中的项与之前版本图形中旧方框中的项形成对比。进行对比可能是方差分析最强大的方面,因为它允许对重点生物假设进行检验。BEF实验中的典型对比是单一栽培与混合栽培、线性或对数线性物种丰富度或特定物种或物种组合的存在之间的对比。一旦找到了一个好的模型,在进行单Df检验时,应将检验结果与效应大小和效应方向一并显示出来。衡量效应大小的一种方法是%SS,它可以很容易地添加到方差分析表中。但是,我们必须牢记,一个项所解释的方差也包含一部分偶然解释的方差(与该项无关的VC,见表1中的EMS)。要找出效应的方向,就必须获得相应的参数估计,正如非正交性一节所解释的那样,最好的方法是拟合一个模型,将所有项都作为最后一个项,然后查看其估计值。采用这种方法,生物学上的解释是,在分析中,效应已经对其前面的所有项进行了调整,但没有对后面的项进行调整。由于复杂分析中的效应大小及其显著性取决于特定的模型,因此使用适当的图表表示数据也很重要。在散点图中显示单个原始数据通常很有用,因为这些数据并不取决于用于分析的统计模型。此外,原始数据的不同子集可以显示在不同的面板中,或者可以使用符号来表示属于不同层次解释因素的单个原始数据(例如,见图2和图5),这样仍然可以避免统计模型的任何依赖性。但除此之外,依赖性是无法避免的。因此,每个显示均值、回归线、标准误差等的图表都应明确说明这些参数估算值来自哪个模型。在进行分层数据分析后,需要特别注意参数估计。在这种情况下,固定效应的估计值必须根据随机效应进行调整,因此可能与非分层数据分析或使用原始数据得出的估计值不同。
A
guide to analyzing biodiversity experiments
Journal of Plant Ecology (IF = 3.0)Bernhard
Schmid*, Martin Baruffol, Zhiheng Wang, Pascal A. Niklaushttps://doi.org/10.1093/jpe/rtw107文章翻译仅代表译者的理解,如需参考和引用相关内容,请查阅原文。