通常使用从数据中估算出的超体积来分析生态位空间或性状空间的大小和形状。hypervolume R软件包以前通过描述性统计而非推断性统计来支持此类分析。这一缺陷限制了在比较或分析超体积时使用假设检验和置信区间。 我们介绍了该R软件包的新版本,它提供了重采样、建立置信区间和假设检验的非参数方法。这些新方法可用于减少分析的偏差和方差,并为超体积分析提供统计意义。 我们在树种的气候生态位和企鹅物种的功能多样性的真实数据集上说明了使用方法。我们分析了各自生态位或性状空间的大小和重叠情况。 这些统计推断方法提高了超体积分析的可解释性和稳健性。
1 引言
Hutchinson(1957)提出了“超体积”(hypervolume)概念,该概念描述了物种沿多轴的需求,即物种的生态位或集合体的功能多样性。Blonder (2018)对这一概念进行了评述,它已被广泛使用。n 维超体积是在多个连续值维度内定义的形状,其中存在一个距离度量。超体积允许对高维数据集进行几何解释,并可用于生成数据集形状、体积和重叠的统计数据。人们提出了许多方法来估计超体积及其属性,例如R软件包hypervolume(2018)、TPD(2019)、nicheROVER(2015)、dynRB(2016)、BAT(2020)和hyperoverlap(2020)。
这些方法中的大多数都是在不考虑抽样过程的情况下进行描述性统计。这往往排除了推理统计的计算。转向统计推断可提高这些方法得出的结论的可靠性,并扩大假设检验的范围。
一些现有算法确实以有限的方式考虑了推理。在高斯核密度估计的情况下,假设数据是随机变量的样本,并且是独立同分布(independent and identically distributed)的。其他方法还开发了对异常值具有鲁棒性的统计方法。重采样被用于确定超体积是否与零期望值不同。然而,假设检验却较为罕见。然而,许多这些研究都是使用非公开代码实现的,限制了标准化和其他研究者的重复使用。
在estimate_bandwidth中,用于box和Gaussian核密度估计的 Silverman 带宽估计器的定义从改为。这一变化符合该估计器的最佳多元定义。原始的单变量估计器仍然可用。此外,对于所有带宽估计,现在都设置了一种属性方法,以便在重新采样时使用相同的方法重新计算带宽向量。
2 材料和方法
为了自助(bootstrap)超体积,需要用重新采样的数据构建新的超体积(图 1)。新的超体积保留了用于构建原始超体积的所有参数。新超体积的数据是从原始数据中替换采样的。
通过重新采样的超体积得到的点估计值的量值可用来创建置信区间。随着样本量的增大,bootstrap点估计值即使存在偏差,也会更加准确。然而,在样本量较小的情况下,偏差并非总是可以忽略不计。在比较两个超体积时,可以通过降低其中一个超体积的样本量,使两个超体积的样本量相匹配,从而减轻样本量造成的偏差。我们假设由样本量引起的偏差项是相似的,并相互抵消。
另一种重新取样的方法是在对超体积进行引导时引入权重。加权引导对每个数据点进行加权。特定点被重采样的概率与该点的权重成正比。加权自举产生的唯一点甚至比普通自举样本更少,因此加权自举只能在较大的数据集上进行。图S1展示了应用大权重的效果。
函数hypervolume_resample实现了上述重采样方法。用户可以选择bootstrap、weighted bootstrap或 bootstrap seq方法参数。bootstrap seq选项以不同的重采样大小执行多次bootstrap。这用于研究样本大小对超体积描述性统计方差和期望值的影响。有关超体积bootstrapping的更多详情,请参阅附录S1。
在比较两个不同的数据集时,对超体积进行置换是非常有用的。通过将两个数据集合并并对数据标签进行洗牌,就可以进行置换。等同于对合并数据进行无替换采样,前N个采样被赋予一个标签,其余M个观测值被赋予另一个标签。如图2所示,在对超体积进行置换时,会为每个数据点分区构建新的超体积。如果我们假设来自两个数据集的所有观测数据都是独立且同分布的,那么每组经过置换的超体积与原始数据具有相同的观测概率。
图2 (a)置换过程从两个超体积开始。数据为n=2维的巴布亚企鹅和阿德利企鹅的功能多样性。(b)将观察到的m=187只巴布亚企鹅和m=146只阿德利企鹅的数据汇集起来,并随机分成大小为187和146的两组,与原来的群体大小相对应。(c)从随机拆分的观测数据中构建置换超体积。
函数hypervolume_permute接收两个超体积并对数据标签进行置换,然后分割数据并使用洗牌后的数据构建两个新的超体积。与hypervolume_resample类似,该函数保留了数据大小、超体积构建方法和每个超体积的参数。有关超体积置换的更多详情,请参阅附录S2。
重叠检验是一种分布检验,检验统计量是由超体积计算得出的重叠统计量。重叠检验的零假设是两个样本(大小分别为N和M)的分布相同。
检验的第一步是合并样本。通过bootstrapping或permutation,从合并数据中反复重新采样数据集。从重新采样的数据中创建的超体积对用于生成重叠统计量。样本重叠统计量的分布构成非参数null分布。重叠统计量的p值是比观测值更极端的样本null统计量的百分比。例如,两个集合之间的Jaccard相似度指数对于不重叠的集合为0,对于完全重叠的集合为1,因此在null假设下,来自同一分布的两个样本的Jaccard相似度指数应更接近于1。观察到的Jaccard相似性指数的单尾p值定义为小于或等于观察值的null Jaccard相似性指数值的分数。
从合并样本中重新取样可以使用或不使用替换法。通过无置换重采样创建两个数据集相当于进行一次置换检验。当进行替换取样时,合并数据被视为原始分布的近似值,并从合并数据中进行bootstrapping取样。
由于获得任意一对大小为N和M的bootstrapping超体积的概率相等,因此通过将每个重新取样的大小为N的超体积与每个重新取样的大小为M的超体积重叠来生成null重叠统计量。关于何时使用置换法和自助法的更多信息,请参阅附录S3。
函数hypervolume_overlap_test支持两种重叠检验方法,并返回p值和模拟的零分布。支持的重叠统计量包括Jaccard相似性指数、Sørensen相似性指数、第一个超体积特有点的比例和第二个超体积特有点的比例。证明重叠检验统计能力的模拟结果见附录S4。
软件包通过接受或拒绝随机点来表征超体积的内部,两个超体积之间的重叠由这些随机点之间的距离决定,如Blonder等(2018)所述,以及Laini等(2023)所述的占用率(重叠在一个点上的超体积数量)。occupancy_to_intersection和hypervolume_n_occupancy这两个函数可以在比较多个超体积的重叠度和占用率时降低误差率。这些函数避免了对多对超体积重复应用hypervolume_set时所需要的顺序降采样问题,而顺序降采样会大大增加多重比较的假阳性和假阴性误差率。函数occupancy_too_intersection只保留参与计算的所有超体积共享的随机点。根据这组点生成一个新的超体积,对应于所有输入超体积的交集。相反,函数hypervolume_n_occupancy会保留所有随机点;对于每个随机点,它会计算所有超体积或各组超体积的汇总统计量(绝对数、平均值)。提供了一个置换检验,以检验用hypervolume_n_occupancy生成的超体积成对组合之间的差异。函数hypervolume_n_occupancy_permute会按照用户指定的次数,将原始超体积随机分配到两组对比对象中的一组。然后使用hypervolume_n_occupancy_test函数进行测试,计算观察到的差异(例如包含给定随机点的超体积平均数量的差异)小于或大于偶然预期的次数。可进行单尾和双尾测试。关于hypervolume_n_occupancy_test性能的模拟分析结果,请参见附录S5。
我们考虑这样一种情况,即我们希望确定一个物种的生态位体积是否大于另一个物种。我们使用Worldclim中被转换为n = 4维(年平均温度、温度季节性、年降水量、降水季节性)实现的生态位空间的Quercus alba和Q. rubra的地理出现点。Q. rubra的出现次数(M = 2110)多于Q. alba(M = 1669)。我们使用超体积重采样法(hypervolume_resample)和自助序列法(bootstrap_seq)来研究两种气候生态位的估计体积如何随样本大小而变化。从样本量M = 100开始,以400为增量,对Q. alba和Q. rubra的观测数据进行下采样,以评估超体积的体积。为了建立置信区间,我们对每个样本量的数据进行了20次重新取样。
我们评估了Acacia和Pinus这两个特异植物属的气候生态位占用率,计算了气候空间内每个点占据了多少物种的生态位。我们从BIEN数据库中下载了这两个属中每个物种(Acacia 60种,Pinus 63种)的出现数据。气候数据来自Worldclim。我们选择了三个气候变量:年平均气温(bio1)、年平均降水量(bio12)和最暖季度降水量(bio18)/(bio18 + 最冷季度降水量(bio19))。气候层在构建超体积之前经过Z变换。每个物种的生态位均使用hypervolume_gaussian函数(默认参数)构建。使用hypervolume_n_occupancy函数,利用box方法和平均值汇总统计获得属水平的占用率。使用hypervolume_n_occupancy_permute和hypervolume_n_occupancy_test函数,通过双尾检验(999次排列)确定某一属的生态位空间的哪一部分显著高于另一属。
我们考虑了利用有地理偏差的物种出现取样来估计气候生态位的情况。在quercus数据集的这个例子中,西经75°以东的Q. alba观测数据的取样频率是其他观测数据的一半。我们要问的是,这种有偏差的取样是否会显著改变气候生态位。我们将经度大于西经75°的每个数据点的权重定为 2,将其他每个点的权重定为 1,然后根据上述quercus分析,利用每个地点的气候数据构建一个超体积。利用weighted bootstrap的权重和 hypervolume_resample,我们通过hypervolume_overlap_test,将原始数据构建的超体积与weighted bootstrap构建的超体积进行比较。
利用上述quercus数据,我们使用hypervolume_overlap_test和sorensen指标检验了两个物种的气候生态位是否具有共同的分布。我们进行了自助重叠检验,并从合并的Quercus数据中自助了每种大小的100个超体积,得到了由10,000个重新采样的Sørensen相似性指数观测值组成的零分布。我们还进行了置换测试,并生成了由1300个Sørensen相似性指数组成的第二个零分布。
3 结果
图3显示了两个物种在不同重采样大小下的超体积。随着重采样大小的增加,重采样体积逐渐接近真实体积,因此图中提供了一种近似收敛水平的方法。然而,推论仍然局限于现有的样本大小范围。可以通过这些曲线的外推法来预测更大的样本量。在这种假设下,Q. rubra和Q. alba的体积估计值似乎都没有趋近于其真实值。
然后,我们比较了由每个数据集的M = 1669个点(Q. alba的观测点数量)大小的重样本构建的超体积。我们观察到,Q. alba的95%置信区间为 [0.147, 0.186],而Q. rubra的 95%置信区间为[0.177, 0.251]。检查95%置信区间的重叠相当于一个保守的检验,得出的推论是物种的生态位体积没有显著差异。
利用hypervolume_n_occupancy函数从气候数据中得到的Pinus和Acacia的超体积在多维空间中高度重叠(图4)。两个属的平均占用率都很低(Acacia=0.06;Pinus=0.08),这表明每个属的大部分多维空间都被一个或少数几个物种占据。不过,Pinus的最大占用率值(0.54)高于Acacia(0.37)。因此,Pinus中超过54%的物种水平超体积共享相同的气候生态位空间。
图4 n = 3 维度的Pinus和Acacia气候生态位数据。每个观测点代表123个物种水平超体积内部的一个随机取样点。下三角矩阵显示了使用hypervolume_n_occupancy函数获得的占用值。上三角矩阵显示了双尾排列检验的结果,以检测两个属占用率之间的差异。仅报告了显著差异,阴影表示差异的大小,颜色表示差异的方向(例如,橙色表示Pinus的占用率高于Acacia)。
两个属之间在气候生态位空间中物种水平超体积重叠最多的区域有所不同。根据置换检验,Pinus的气候生态位有8.08的体积(占Pinus生态位的21%),其占用率明显高于Acacia。此外,Acacia的气候生态位体积为 1.98(占Acacia的 6%),其占用率明显高于Pinus。
使用bootstrap方法进行重叠检验的结果如图5所示。p值为0.124,因此我们不拒绝“偏取样不影响生态位分布”的零假设。
图5 在西经75°以东的所有观测数据获得双重加权后,Quercus alba气候生态位与加权重采样的气候生态位之间的Sørensen相似性指数的经验零分布。红线表示观测到的重叠统计量(p = 0.124)。
在Quercus数据集中,自助重叠检验的p值远远低于置换重叠检验的p值(图6)。然而,由于两个p值都小于0.05,我们可以拒绝两个物种具有完全相同气候生态位的零假设。
图6 两个超体积之间Sørensen相似性指数在(a)引导重叠检验和(b)置换重叠检验中的经验零分布。红线表示观察到的重叠统计量,黑条表示零分布。自助重叠检验的p值为0.0004,置换重叠检验的p值为0.047。这里的数据是为Quercus alba和Q. rubra构建的n=4维气候生态位数据。
4 讨论
利用超体积特性的点估计得出结论的研究可能需要重新审视。其中一种情况是确定是否有足够的证据证明超体积之间存在重叠。另一种情况是,当样本大小不同时,确定超体积之间的体积差异是否有效。
R软件包中的现有方法旨在将未知样本分布与另一个未知分布进行比较,即在没有已知或合适的参数分布的情况下。由于这种方法是非参数的,因此软件包不会报告似然值或任何基于已知分布的统计量,例如似然比检验或AIC值。
我们没有与其他现有方法进行比较。nicheRover软件包确实提供了重叠估计的概率,但仅限于参数假设(多元正态)。dynRB软件包提供了一些推论工具(理论处理见Parkinson 等),但不能用于占用或多重重叠。其他软件包,例如 hyperoverlap(2020)只提供点估计,因此尚无法比较推断性能。Di Cola等(2017)提供了一些重叠测试,但仅适用于二维数据集。使用标准化数据集对这些方法或未来的方法进行独立比较研究将非常有价值。
5 结论
文献信息