功能多样性分析在生态学中的应用在过去二十年中急剧增长,拓宽了我们对生物多样性及其跨时空变化的理解。几乎所有生态学分支学科都认识到从功能角度观察物种和群落的重要价值,这导致了估算功能多样性不同维度的方法激增。 这些方法之间的差异及其发展造成了术语上的不一致,以及在选择最合适的方法来解决任何特定生态问题时的混乱,阻碍了比较研究、模拟练习和meta分析的潜力。 目前有两种估算功能多样性的通用数学框架:一种是基于相异性矩阵(如Rao熵、功能树状图)的框架,另一种是基于多维空间的框架,即凸包或概率超体积。 我们回顾了这些框架,讨论了它们的优缺点,并概述了执行这些计算的主要R软件包。与此同时,我们还提出了一种在统一方案中组织功能多样性度量的方法,以量化每个框架下物种或个体的丰富性、离散性和均匀性。这一概述为从理论和实践两方面自信地进行功能多样性分析提供了路线图。
1 引言
生物体的属性和功能不尽相同,也就是说,生物体所做的事情范围不尽相同,这一观点由来已久。例如,早在公元前四世纪,Theophrastus就认识到植物可分为具有相似特征(性状)的类别,如木质和大小。随着生态位概念的提出以及随后功能生态学作为一门科学学科的兴起,类似的先驱观察得到了更正式的定义。当同名期刊《Functional Ecology》于1987年创刊时,其编辑委员会对这门学科的潜在成功持谨慎甚至怀疑态度。他们写道:“看到这本创刊号[......],你的第一反应可能是绝望地举起双臂,因为你想到了又一本初级科学期刊”。现在,功能信息已被证明是现代生态学的关键支柱,也是生物多样性的一个重要维度。
在过去二十年中,我们目睹了基于性状的研究呈指数级增长。这主要是由一些开创性的论文推动的,这些论文说明了一种从功能角度重新思考整个生态领域的方法,从种群和群落生态学到生物地理学,以及保护生物学。在这一知识遗产的基础上,利用功能多样性研究不同时空尺度的生态模式现已成为常规方法。
在理论快速发展的同时,研究功能多样性的方法也层出不穷。如今,有各种各样的算法和框架(以下简称“方法”)可用于划分特定物种或群落所占据的性状空间,每种方法都基于特定的数学对象——原始数据、距离矩阵、树、凸包、核密度超体积等(术语表见表1)。一旦生成了性状空间,就可以使用更多的指数(以下简称“度量”)来计算系统的特定属性。尽管这种方法和度量的广泛可用性使我们对生态系统功能的理解取得了巨大进步,但也有人指出,这也“[...]造成了为特定问题选择适当方法时的许多混乱”。
我们认为,造成这种混乱的直接原因有两个。首先,很少有人对每种方法进行比较,以说明其优缺点和局限性。我们作为稿件审阅者和编辑、现有文献的读者以及早期职业科学家的导师,我们的经验告诉我们,大多数用户经常使用一种方法或指标,只是因为它发表在一篇著名的论文中或出现在谷歌的首页,而不是因为它更适合他们的问题和数据。其次,研究人员在开发功能多样性方法的基础统计数据时,通常只为用户提供有限的功能度量计算函数,或者对具有相似性质的度量使用不同的名称。
Pavoine和Bonsall(2011)提出了一种语义分类法,用于在统一方案下对分类学、系统发生学和功能度量进行分类。Tucker等(2017)进一步改进了这一分类方法,确定了多样性的三个不同维度:丰富性、离散性和均匀性。这三个维度捕捉到了每个度量指标内在的主要数学运算,即
丰富度(richness)维度包括反映观察结果之间差异总和的度量;
离散性(divergence)维度包括反映观察结果之间平均差异的指标;以及
均匀性(regularity)维度包括反映观察结果之间差异规律程度的度量。
该方案具有通用性,既可用于丰度、存在/不存在或其他数据,也为功能指标的分组提供了简单直观的依据。该分类方案还在第二个信息轴上进行了划分,反映了计算每个指标时的数据组织水平(组)。在系统发育指数分类中,Tucker等使用了两个组织层次,取决于每个指标是在一个集合内计算(如物种内的个体或群落内的物种;即所谓的α-多样性),还是在集合间计算(如多个物种或群落在空间和时间上的比较;即所谓的β-多样性)。在此,我们将第二信息轴扩展为三个组织层次,即
观测水平(Observation level),代表一个集合(如个体、种群或物种)中不同的功能要素;
组内(Within groups),代表一个集合内的所有观测水平要素(如种群、物种、群落或区域内的功能多样性);以及
2 功能多样性估算的数学方法
源于生态功能群(ecological guild)的概念,功能多样性最简单的数学估算方法是使用原始性状数据矩阵,将总的功能丰富度计算为给定观测数据集中独特功能组合(功能群)的数量。虽然“功能群”这一概念直观地反映了功能多样性,但研究人员很快就发现这种方法过于简单。此后,人们开发了大量更复杂的方法来表示系统中观察到的性状多样性及其关系。在本综述中,我们将这种性状多样性的表征称为“性状空间”(表1)。
我们将不对所有已发表和使用的方法进行概述,因为这很可能会造成进一步的混淆。我们选择只讨论以下方法:
1)开放和免费,这与今天在R中实施和维护的软件包和函数实际上是一致的;
2)尽可能多的受众都能使用,即有详尽记录的方法,因此不需要高水平的数学、统计或编程知识;以及
3)以稳健的数学概念为基础,提供易于理解的性状空间表示。
我们认为,在最近的文献中,有两种估算性状空间及其属性的通用数学方法:一种是基于无序矩阵的方法(非维度表示法),另一种是基于有序多维空间的方法(即多维表示法)。下面我们将简要介绍这两种方法,讨论它们的优缺点(表2),并列出可用于实际计算的主要R软件包(表2)和函数(表3)。
所有这些方法都依赖于将性状矩阵转换为相异矩阵;反过来,转换后的矩阵可用于划分性状空间并探索其特性。在此,我们将试图直接测量性状空间熵(即观测值之间的相异性)的方法和度量标准与使用基于距离的树状图对象来表示性状空间的方法和度量标准区分开来。
虽然所有这些方法都有一些特点,使它们比多维框架更有优势,但至少有两个主要的注意事项适用于所有方法。首先,这些方法与Hutchinson的经典生态位概念关系不大,因为它们没有根据定义的生态位轴来组织性状空间。其次,选择使用的距离度量并非易事,特别是因为性状矩阵经常是不同数据类型的混合物——连续、有序的、分类和二元数据——这会对结果产生重大影响。
这类方法基于功能多样性代表物种间性状差异程度的概念。这些方法无法直接实现性状空间的可视化[但可参考Micó等(2020)的变通方法],而更多的是对性状矩阵基于熵的特性进行度量。常用的四个指标是
Rao二次熵(Rao quadratic entropy ,Rao),代表随机取样的两个不同个体、种群或物种之间的预期差异;
功能离散度(Functional dispersion ,FDis),参见Laliberté和Legendre(2010),表示个体物种到所有物种中心点的加权平均距离;
平均成对相异度(Mean pairwise dissimilarity ,MPD),代表随机选择的两个物种之间的预期相异度,不进行替换;以及
希尔数(Hill numbers),代表一个群体中数量相等、功能不同的物种的有效数量。
这些指标之间的差异很微妙,但却具有重要的实际影响。Rao和FDis与方差具有相同的数学基础,因此它们被认为是基本等价的。相反,在MPD中,预期相似度的估计仅考虑不同物种的个体,因此无法考虑种内变异性,这一点与Rao不同。与其他方法相比,使用平均相异性方法的最大优势在于其与分类学和系统发育多样性的明确联系。另一个优点是,所有这些指标都允许将物种丰度信息纳入功能多样性的估算中,也允许使用含有缺失信息的性状数据(只要所选的相异性指数允许)。
然而,这些方法也有缺点(表2)。除了前面讨论过的一般注意事项外,主要的限制可能是没有一个单一的平均相异性指标能够测量性状空间的丰富性、离散性和均匀性成分。虽然Rao度量和相关度量非常适合估算离散成分,但它们并不能很好地用于其他研究场景。此外,Rao(以及作为推论的FDis)与辛普森指数之间的数学关系的一个结果是,Rao与物种丰富度无关,而是与物种丰富度呈渐近递增关系。
Petchey和Gaston(2002)在一篇具有里程碑意义的论文中提出,将给定群落或地点的性状空间表示为物种间功能关系(距离)的树状图,据此可将总功能丰富度计算为树的总分支长度。性状空间的树状图直观形象,可以直观地显示物种或个体之间的功能关系。此外,这种计算性状空间的方法与基于树的系统发育多样性密切相关,从而为比较生物多样性的不同维度(系统发育多样性和功能多样性)提供了一个基于树对象的一致框架。当然,基于树状图的性状空间表示法也有缺点(表2)。除了之前讨论过的与物种生态位缺乏直接关系的问题外,树状图与最初用于构建树状图的相异性矩阵相比,可能会改变物种间的相异性。
Rosenfeld将功能多样性定义为观测值在多维空间中的分布,多维空间的轴线代表感兴趣的性状。换句话说,观察值在多维空间中的位置可以用来描述一个多维对象(超体积)的不同方面,这个多维对象包含了在群体中观察到的所有性状值。
人们对性状空间(以及生态位)的多维表征越来越感兴趣。例如,有人讽刺地指出,现在“这些多维空间的定义[......]可能与此类方法可以解决的问题一样多”。在此,作为一种综合方法,我们将这些方法分为两类:一类是根据性状空间是否被占据对其进行二元描述,另一类是通过对观测密度建模对性状空间进行概率描述。
凸包——围绕一组观测值的最小凸多面体——可以说是最简单的超体积类型,它为性状空间提供了直观的几何表示,易于体现物种性状通常具有的连续性。这种方法由Cornwell等(2006)首次提出,后来由Villéger等(2008年)推广,他们描述了一种使用凸包进行功能丰富度估算和探索群落间更替的方法。凸包在功能生态学中的应用由来已久,其性能已在大多数生物界、生物群落和空间尺度中得到检验。与性状空间的矩形表示相比,凸包的优势在于它排除了不规则分布的“缺失角”。在n≥2维中,与(超)立方体或(超)球体相比,它还能减少空白空间的数量。最后,凸包的计算时间可能比概率超体积更快。
然而,在功能生态学中,凸包有两个主要缺点(表2)。首先,它们对异常值非常敏感。其次,它们只能用于探索功能多样性的丰富度维度(表3)。此外,凸包极值内的空间被假定为均质的,这意味着性状空间在极值内被均匀占据。这既可以看作是这种性状空间表示方法的限制,也可以看作是其特征,强调了凸包与概率超体积之间的内在差异。为了部分弥补这一问题,Gruson(2020)最近提出了一种基于α形创建“凹”包(即包括空隙或口袋)的方法。虽然该方法是为估算生物体的颜色体积而开发的,但很容易推广到其他性状。
基于密度的方法不像凸包那样假设性状空间是均匀的,而是允许在多维空间中检测密度较高或较低的区域。因此,概率超体积反映了一个概念,即在给定性状空间的边界内,并非所有区域都充满了相同的强度。性状空间的这种表现形式更好地反映了Hutchinson提出的生态位概念,他认为多维生态位应该具有“密度”上的内部差异——尽管当时还没有类似的计算方法。
概率超体积在功能生态学中的受欢迎程度正在稳步上升,近年来发表的大量R算法都证明了这一点,这些算法可以划分和/或分析概率超体积。不可避免的是,这些性状空间表征与其他表征一样,也存在缺点,至少在目前的表述中是这样(表2)。样地密度取决于所使用的方法和参数,目前还没有明确的最佳选择指南。此外,这些方法对计算要求较高,尤其是在高维度下。
3 针对具体研究问题的功能多样性维度
大多数情况下,描述一个性状空间的原因是探索其与感兴趣的研究问题相关的特性(图1;附录S1)。要做到这一点,可以在丰富性、离散性和均匀性领域的特定组织水平上对性状空间进行研究。在此,我们提出了一种使用简单、统一方案(表3)对现有功能指标进行分组的方法。这是一种尝试,旨在为大量可用的度量标准提供一定的秩序,有助于将丰富度、离散性和均匀性概念(BOX 1)应用于不同的组织层次和空间尺度。有趣的是,除了强调用于探索性状空间的度量标准既有互补性也有冗余性之外,这种分类工作还让我们指出了目前可用度量标准中存在的差距,从而有可能促进未来新度量标准的发展。
现有度量标准可根据其计算的数据组织水平进行划分。度量指标可针对个体观测值(个体、种群或物种)、群体内观测值(例如,物种内的个体或群落内的物种;即所谓的α-多样性)或群体间观测值(例如,多个物种或群落在空间和时间上的比较;即所谓的β-多样性)进行计算。
观测数据对种群、物种或群落所占的性状空间或种群、物种或群落之间的差异有不同的贡献。为反映一个观测值在性状空间中相对于其他观测值的位置,人们制定了不同的衡量标准,包括原始性、独特性和贡献性(表3)。所有这些度量方法都以不同的方式量化一个观测值与所有其他观测值的不同程度,从而量化该观测值对群体度量的贡献程度。这可以应用于丰富度、离散性和均匀性,从而在不同的组织尺度上映射出功能稀有性和共同性的不同组成部分。
组内水平(通常称为α多样性或简称α)反映了一组观测值的属性,而不涉及其他组。观察结果会增加特定性状空间的占有率,以不同方式描述物种或群落的特征。这是迄今为止功能多样性研究中探讨最多的层次。
群体之间的差异反映了自然界中的自然异质性,即种群、物种和群落在空间和时间上的差异。这一特性也称为β多样性或β,最早被定义为群落组成沿梯度变化的程度。此后,这一术语的使用范围不断扩大,但始终包含某种组成异质性或分化。重要的是,物种或群落及其功能差异的形成有两个不同的过程:性状空间的替代和性状空间的净增减[关于物种,请参见Carvalho和Cardoso(2020);关于群落,请参见Cardoso等(2014)]。在对群落进行比较时,我们可以了解空间或时间上的生态位转移如何与竞争或生态释放以及随之而来的性状进化相关,或者探索性状多样性如何随着空间距离或时间的变化而衰减。
一旦确定了感兴趣的组织层次,我们就可以通过测量其丰富度、离散性和均匀性领域的属性来探索性状空间(BOX 1)。附录S1提供了功能多样性方面的具体研究方案和问题示例。
在估算功能丰富度时,我们试图回答与集合体所占性状空间的数量及其在空间和时间上的变化有关的问题。这些问题包括:如果一个物种灭绝或一个群落发生变化,我们将失去哪些生态过程和生态系统服务;特定生境对物种性状的过滤效应;以及群落的功能性在不同季节如何变化。在更广泛的宏观生态尺度上,许多研究探讨了热季节性(纬度;、冰川覆盖或城市化)梯度上的功能丰富度变化。绘制性状丰富度地图还可以根据物种丰富度以外的标准确定优先保护区域。例如,我们可以估算常见和稀有物种对生态系统净功能的重要性,确定物种层面的保护重点,甚至可以比较不同类群的灭绝风险。
功能多样性的离散性指标旨在评估观察结果之间的差异,即观察结果在所占性状空间中的扩散程度,通常是相对于平均值或中心点而言。高分散度通常被解释为反映了具有相似性状的物种之间的高度竞争,和/或松弛的生态过滤。一些学者还将离散度解释为功能冗余度的衡量标准,从理论上讲,冗余度较低的群落应该是那些生态过滤较松的群落。从生物保护的角度来看,功能冗余度较高的系统应具有更强的抗干扰能力,例如,当单一物种面临灭绝或消失时,它所扮演的角色可由功能相近的物种来完成。
均匀性成分或均匀度反映了观测值在性状空间内分布的规则性。就原始数据而言,均匀性通常衡量性状值的偏斜程度;就图形而言,它可以被视为所占性状空间形状和谐程度的衡量标准——功能树状图中分支的对称性或概率超体积形状的规则性。从生物学角度来说,均匀性是用来考察特定生态位空间的全部可用资源的有效利用程度。当最丰富的物种共享性状空间时,就会出现环境对特定性状的强烈过滤。反之,如果最丰富物种的性状值之间的间隔更有规律,性状之间的重叠程度更低,则意味着竞争排斥的作用更强,不过在从功能多样性模式推断集合过程时应小心谨慎。一个实际的例子来自洞穴生态系统,在洞穴生态系统中,永久性的黑暗和随之而来的光合初级生产者的缺乏会产生强大的过滤作用,使总的性状空间偏向于过度表达食腐动物和捕食者的性状或采用特殊狩猎策略的物种。
4 与功能多样性分析有关的其他考虑因素
必须记住,每种方法的性能和功能多样性分析的整体质量都取决于实验设计和数据的质量。与数据质量及其探索有关的问题有几个;我们将简要讨论与本文讨论的分析框架最相关的几个问题(图1)。
在探索任何性状矩阵时,我们必须意识到它可能是不同数据类型(数值、有序、模糊或分类性状)的混合物,这些数据类型可能相关也可能不相关。为了在同一分析中处理不同的数据类型,并根据相关功能多样性方法的假设,可能需要对性状进行标准化,并使用适当的距离测量和/或排序方法对矩阵进行转换。相关性和图形工具(如散点图)可用于检查共线性,在适当的情况下,相关性状可被剔除或总结为主成分轴。最后,还必须考虑如何处理缺失数据、性状变异性以及其他问题。
性状空间划分的性状数量也是一个关键特征。随着性状数量的增加,多维分析将受到“维度诅咒”的影响。维度不仅会增加计算时间,还会影响性状空间的属性。例如,在概率超体积背景下,随着维度的增加,空间占用会变得更加稀疏,并倾向于发生在超体积的边界。此外,超体积重叠只会随着维度的增加而减少,这直接影响了组间指标和冗余度的估算。但请注意,这往往是真实生物特征的结果:由于两个物种可能在许多性状上存在差异,因此在考虑大量性状时,它们不太可能有太多重叠。
归根结底,性状数量的选择取决于总体样本量和提出的问题,但在这个问题上并没有统一的意见。例如,对植物的分析表明,通过增加新的性状,我们预测群落组成的能力会提高,根据系统的不同,在增加四到八个性状时会达到一个高点;但是,当增加的性状过多时,功能多样性的估计就变得不可行和/或不可靠。未来的模拟研究将比较不同技术在不同样本量和性状数量下的表现,这将有助于在此意义上制定更精确的指导原则。
最后,有必要提及的是,要正确处理功能多样性分析,通常需要使用随机化程序,将观察到的模式与零期望进行比较。随机化程序用于推断某些特定的过程和/或检验感兴趣的假设,同时也用于打破某些功能多样性指标与物种丰富度之间微不足道的相关性。例如,由于功能丰富度通常会随着一个群体中新生物的加入而增加,生态学家经常使用零模型来比较观察到的功能丰富度值与从所考虑的物种库中随机组合的相同数量物种的预期值。
5 结论
我们在此说明了在一些非重叠框架上正在形成的共识,这些框架用于划分性状空间并测量其特性。我们希望,通过对现有概念(表1)、方法(表2)和指标(表3)的归纳总结,能为简化功能多样性分析(图1)提供实用的概述和工作流程。从这项工作中可以得出五条启示:
不要把苹果和橘子混为一谈。许多研究采用不同的方法和指标来计算功能多样性的属性。例如,许多基于R软件包FD的研究就是这种情况,该软件包将丰富度估算为凸包的体积,将离散度估算为观测值到中心点或重心的距离,并用最小生成树估算均匀性。在可能的情况下,我们建议选择一种单一的方法来划分性状空间(如功能树状图或多元空间),并坚持使用这种方法来探索其丰富度、离散性和均匀性方面的特性。事实上,使用单一方法可以确保所有计算都有类似的误差和不确定性。反之,如果使用不同的方法,则可能难以将所关注的生态过程的影响与所使用的不同算法的影响区分开来。当使用不同的框架(如前者使用超体积,后者使用系统发育树)同时研究功能多样性和系统发育多样性时,也会出现同样的问题。理想情况下,我们希望消除结果中的一个不确定性,即与方法选择相关的不确定性,即使其他不确定性必然存在。
注意不确定性。在理想情况下,通过使用不同的方法计算类似的指标——例如,使用树状图或凸包计算的功能丰富度——可以得出相同(或趋同)的结果。然而,正如一些针对不同方法和指标的比较研究所强调的,这种情况很少发生。差异部分与每个框架的内在差异有关(表2),部分与分析尺度和如何处理性状变异的方法选择有关,以及考虑的性状数量有关。我们认为有必要利用真实世界的数据或基于不同性状组合、组织尺度和输入参数的模拟,全面分析现有方法的特性。在此之前,我们必须承认,我们通常并不完全了解每种方法和指标的确切衡量标准。
驳斥狭隘主义。目前有很多功能多样性方法和度量标准,未来可能还会开发出更多。对于首次接触功能多样性分析的研究人员来说,这无疑会让他们感到迷茫,但即使对于经验丰富的研究人员来说,在看似同样合适的选项中做出选择仍然具有挑战性。不可避免的是,大多数研究人员会倾向于坚持自己“钟爱”的方法。然而,重要的是要记住,任何分析选择都应始终根据感兴趣的生态问题(附录S1)和每种方法的优缺点(表2)进行微调,而不是主观偏好。
沉溺于未知。现有度量方法的广度永远无法让我们探索特定性状空间中观测分布的所有属性,也无法回答潜在的无限生态进化问题。在处理新的范式和系统时,我们往往需要重新开发度量标准或功能。如果缺乏编程技能,有一些工具可以帮助完成这项任务。例如,dispRity框架提供了一个模块化架构,用于创建和测试针对特定数据集和问题的新指标。
文献信息