《联合物种分布模型原理与实践》- 谷际岐博士报告资料共享（视频及R代码）

文摘 2024-06-22 09:38 江苏

2024年6月14日，应上海辰山植物园华东野生濒危资源植物保育中心之邀，谷际岐博士做了题为 “联合物种分布模型原理与实践” 的在线报告。报告获得了热烈的响应，腾讯会议间满员，在线直播（蔻享直播）在报告进行期间达到 6228 人次的浏览量，HelloBD公众号后台也有大量的留言，向我们咨询资料共享与视频回放问题。

在征得谷际岐博士同意后，我们将报告的视频上传到 HelloBD 的 B 站空间中，同时将谷博士R语言源代码分享如下。

报告的视频回放

HelloBD的B站空间

https://space.bilibili.com/1979221372

R语言源代码

library(knitr)
library(ape)
library(MASS)
library(fields)
library(Hmsc)
library(corrplot)

# Set seed for reproducibility
# 设置随机种子
set.seed(1)

# Number of species
ns = 50

# Generate a coalescent phylogeny
# 生成系统发育树
phy = ape::rcoal(n=ns, tip.label =
   sprintf('species_%.3d', 1:ns), br = "coalescent")

# Plot the phylogeny
# 绘制系统发育树
plot(phy, show.tip.label = FALSE, no.margin = TRUE)

# Compute the variance-covariance matrix
# based on the phylogeny
# 计算协方差矩阵
C = vcv(phy, model = "Brownian", corr = TRUE)
spnames = colnames(C)

# Simulate traits
# 模拟物种性状
traits = matrix(NA, ncol=2, nrow=ns)
for (i in 1:2){
  traits[, i] = mvrnorm(n=1, mu=rep(0, ns), Sigma=C)
}
rownames(traits) = spnames
colnames(traits) = c("habitat.use", "thermal.optimum")
traits = as.data.frame(traits)

# Set graphics parameters
# 设置图形参数并绘制图像
par(fig=c(0, 0.6, 0, 0.8), mar=c(6, 0, 2, 0))
plot(phy, show.tip.label = FALSE)
par(fig=c(0.6, 0.9, 0.025, 0.775), 
     mar=c(6, 0, 2, 0), new=TRUE)
plot.new()
image.plot(t(traits), axes=FALSE, legend.width=3, 
   legend.shrink=1,
   col=colorRampPalette(
        c("blue", "white", "red"))(200))

# Simulation of environmental data
# 模拟环境变量
n = 200
habitat = factor(sample(x=c("forest", "open"), 
          size=n, replace=TRUE))
climate = rnorm(n)
nc = 4
mu = matrix(0, nrow=nc, ncol=ns)

# Expected niche calculations
# 预期生态位计算
mu[1, ] = -traits$thermal.optimum^2 / 4
        - traits$habitat.use
mu[2, ] = 2 * traits$habitat.use
mu[3, ] = traits$thermal.optimum / 2
mu[4, ] = -1 / 4
beta = mu + 0.25 * matrix(rnorm(n=ns*nc), ncol=ns)
X = cbind(rep(1, ns), as.numeric(habitat == "forest"),
    climate, climate * climate)
L = X %*% beta
Y = L + mvrnorm(n=n, mu=rep(0, ns), Sigma=diag(ns))
colnames(Y) = spnames

# Data preparation for HMSC
# HMSC数据准备
XData = data.frame(climate=climate, habitat=habitat)
XFormula = ~ habitat + poly(climate, 
         degree=2, raw=TRUE)
TrFormula = ~ habitat.use + thermal.optimum
studyDesign = data.frame(
         sample=sprintf('sample_%.3d', 1:n), 
         stringsAsFactors=TRUE)
rL = HmscRandomLevel(units=studyDesign$sample)
rL$nfMax = 15
rL
# Model specification
m = Hmsc(Y=Y, XData=XData, XFormula=XFormula,
         TrData=traits, TrFormula=TrFormula,
         phyloTree=phy, studyDesign=studyDesign, 
         ranLevels=list(sample=rL))
Y
# MCMC settings
nChains = 2
test.run = FALSE
if (test.run) {
  thin = 1
  samples = 100
  transient = 50
} else {
  thin = 10
  samples = 1000
  transient = 500
}
verbose = 0

# Run MCMC
m = sampleMcmc(m, thin=thin, samples=samples, 
               transient=transient,
               nChains=nChains, nParallel=1, 
                verbose=verbose) 
# Set nParallel=1 to avoid port issues


######## 检验马尔可夫链蒙特卡罗（MCMC）模型收敛性
# 将模型结果转换为Coda对象，以便进行统计分析
mpost = convertToCodaObject(m)

# 设置图形参数，准备绘制六个直方图
par(mfrow=c(3,2))

# 计算Beta参数的有效样本大小，并绘制其直方图
ess.beta = effectiveSize(mpost$Beta)
hist(ess.beta)

# 计算Beta参数的Gelman-Rubin诊断，并绘制其直方图
psrf.beta = gelman.diag(mpost$Beta, 
            multivariate=FALSE)$psrf
hist(psrf.beta)

# 计算Gamma参数的有效样本大小，并绘制其直方图
ess.gamma = effectiveSize(mpost$Gamma)
hist(ess.gamma)

# 计算Gamma参数的Gelman-Rubin诊断，并绘制其直方图
psrf.gamma = gelman.diag(mpost$Gamma, 
             multivariate=FALSE)$psrf
hist(psrf.gamma)

# 从所有可能的物种对中随机抽样100个，用于进一步分析
sppairs = matrix(sample(x = 1:ns^2, size = 100))

# 提取并过滤Omega参数的后验样本
tmp = mpost$Omega[[1]]
for (chain in 1:length(tmp)){
  tmp[[chain]] = tmp[[chain]][,sppairs]
}

# 计算过滤后的Omega参数的有效样本大小，并绘制其直方图
ess.omega = effectiveSize(tmp)
hist(ess.omega)

# 计算过滤后的Omega参数的Gelman-Rubin诊断，并绘制其直方图
psrf.omega = gelman.diag(tmp, 
                multivariate=FALSE)$psrf
hist(psrf.omega)

# 打印Rho参数的有效样本大小
print("ess.rho:")
effectiveSize(mpost$Rho)

# 打印Rho参数的Gelman-Rubin诊断
print("psrf.rho:")
gelman.diag(mpost$Rho)$psrf


######## 评估模型拟合度和进行方差分解
# 计算模型的预测值
preds = computePredictedValues(m)

# 评估模型拟合度，包括计算R平方值，并绘制其直方图
MF = evaluateModelFit(hM=m, predY=preds)
hist(MF$R2, xlim = c(0,1), 
   main=paste0("Mean = ", round(mean(MF$R2),2)))

# 显示模型中使用的环境变量
head(m$X)

# 计算方差分解，分析环境因子（如栖息地和气候）
# 对模型解释的贡献
VP = computeVariancePartitioning(m, 
     group = c(1,1,2,2), 
     groupnames = c("habitat","climate"))

# 绘制方差分解的结果
plotVariancePartitioning(m, VP = VP)

# 使用kable函数以表格形式展示Beta参数的方差分解结果
kable(VP$R2T$Beta)

# 输出Y变量的方差分解结果
VP$R2T$Y

# 获取Beta参数的后验估计，并绘制其支持水平图
postBeta = getPostEstimate(m, parName = "Beta")
plotBeta(m, post = postBeta, param = "Support",
         plotTree = TRUE, 
         supportLevel = 0.95, 
         split=.4, spNamesNumbers = c(F,F))

# 获取Gamma参数的后验估计，并绘制其支持水平图
postGamma = getPostEstimate(m, parName = "Gamma")
plotGamma(m, post=postGamma, param="Support", 
           supportLevel = 0.95)

# 计算物种间的关联性，并根据支持水平进行筛选，绘制关联图
OmegaCor = computeAssociations(m)
supportLevel = 0.95
toPlot = ((OmegaCor[[1]]$support>supportLevel) 
    + (OmegaCor[[1]]$support<(1
          -supportLevel))>0)*OmegaCor[[1]]$mean

corrplot(toPlot, method = "color", 
         col=colorRampPalette(
              c("blue","white","red"))(200),
         tl.cex=.6, tl.col="black",
         title=paste("random effect level:", 
               m$rLNames[1]), mar=c(0,0,1,0))

# 输出Rho参数的统计摘要
summary(mpost$Rho)



######## 构建和分析模型梯度，以探索特定环境变量
## （如气候和栖息地）对物种分布的影响

# 构建以气候为焦点变量的梯度，其中栖息地被视为非焦点变量
Gradient = constructGradient(m, 
           focalVariable = "climate",
           non.focalVariables = list(
                   "habitat"=list(3,"open")))

# 查看新构建的环境数据
Gradient$XDataNew

# 根据新的梯度数据进行预测，并计算预期值
predY = predict(m, XData=Gradient$XDataNew, 
        studyDesign=Gradient$studyDesignNew, 
        ranLevels=Gradient$rLNew, expected=TRUE)

# 绘制关于多样性指标S的梯度图，展示数据点
plotGradient(m, Gradient, pred=predY, 
              measure="S", showData = TRUE)

# 绘制关于生态响应Y的梯度图，指定显示第一个指标，展示数据点
plotGradient(m, Gradient, pred=predY, 
             measure="Y", index = 1, showData = TRUE)

# 绘制关于性状T的梯度图，指定第三个指标，展示数据点
plotGradient(m, Gradient, pred=predY, measure="T", 
               index = 3, showData = TRUE)

# 构建以栖息地为焦点变量的梯度，气候作为非焦点变量
Gradient = constructGradient(m, 
       focalVariable = "habitat",
       non.focalVariables = list("climate"=list(1)))

# 查看新构建的环境数据
Gradient$XDataNew

# 根据新的梯度数据进行预测
predY = predict(m, XData=Gradient$XDataNew, 
           studyDesign=Gradient$studyDesignNew,
           ranLevels=Gradient$rLNew, expected=TRUE)

# 绘制关于生态响应Y的梯度图，
# 选择栖息地使用最高的指标，展示数据点，
# 轻微调整数据点位置以避免重叠
plotGradient(m, Gradient, pred=predY, 
  measure="Y", index=which.max(m$TrData$habitat.use),
  showData = TRUE, jigger = 0.2)

# 绘制关于性状T的梯度图，选择第二个指标，
# 展示数据点，轻微调整数据点位置
plotGradient(m, Gradient, pred=predY,
   measure="T", index=2, showData = TRUE, 
   jigger = 0.2)

######## 错误指定模型的HMSC分析
# HMSC analyses of misspecified models
## Missing environmental covariate
## 缺少环境协变量
# 定义环境变量的公式，这里使用了气候数据的二次多项式形式
XFormula.1 = ~poly(climate, degree = 2, raw = TRUE)

# 创建HMSC模型对象，指定Y（响应变量数据），
# XData（环境变量数据），XFormula（环境变量公式），
# TrData（性状数据），TrFormula（性状公式），
# phyloTree（系统发育树），studyDesign（研究设计），
# ranLevels（随机效应层级）
ma50 = Hmsc(Y=Y, XData=XData, XFormula = XFormula.1,
            TrData = traits, TrFormula = TrFormula,
            phyloTree = phy,
            studyDesign=studyDesign, 
            ranLevels=list(sample=rL))

# 对HMSC模型进行MCMC采样，指定采样间隔（thin），
# 样本数（samples），过渡期（transient），
# 链的数量（nChains），并行数量（nParallel），
# 是否显示详细信息（verbose）
ma50 = sampleMcmc(ma50, thin = thin, 
    samples = samples, 
    transient = transient,
    nChains = nChains, 
    nParallel = 1, verbose = verbose)

# 计算方差分解，评估'climate'变量在模型中的贡献
VP = computeVariancePartitioning(ma50, 
      group = c(1,1,1), 
      groupnames=c("climate"))

# 绘制方差分解结果
plotVariancePartitioning(ma50, VP = VP)

# 计算物种间的关联性，并基于支持水平进行过滤
OmegaCor = computeAssociations(ma50)
supportLevel = 0.95
toPlot = ((OmegaCor[[1]]$support>supportLevel) 
   + (OmegaCor[[1]]$support<(1
         -supportLevel))>0)*OmegaCor[[1]]$mean

# 使用corrplot绘制物种间关联性的热图，
# 使用从蓝到红的颜色渐变
corrplot(toPlot, method = "color", 
         col=colorRampPalette(
           c("blue","white","red"))(200),
         tl.cex=.6, tl.col="black",
         title=paste("random effect level:", 
            ma50$rLNames[1]), mar=c(0,0,1,0))

######## 在缺少某些性状数据时对模型分析的影响
## Missing traits

# 定义性状数据的公式，这里使用了栖息地使用情况作为性状变量
TrFormula.1 = ~habitat.use

# 创建HMSC模型对象，指定Y（响应变量数据），
# XData（环境变量数据），XFormula（环境变量公式），
# TrData（性状数据），TrFormula（性状数据公式），
# phyloTree（系统发育树），studyDesign（研究设计），
# ranLevels（随机效应层级）
m = Hmsc(Y=Y, XData=XData, XFormula = XFormula,
         TrData = traits, TrFormula = TrFormula.1,
         phyloTree = phy,
         studyDesign=studyDesign, 
         ranLevels=list(sample=rL))

# 对HMSC模型进行MCMC采样，指定采样间隔（thin），
# 样本数（samples），过渡期（transient），
# 链的数量（nChains），并行数量（nParallel），
# 是否显示详细信息（verbose）
m = sampleMcmc(m, thin = thin, 
   samples = samples, transient = transient,
   nChains = nChains, nParallel = 1, 
   verbose = verbose)

# 计算方差分解，评估'habitat'和'climate'变量在模型中的贡献
VP = computeVariancePartitioning(m, 
   group = c(1,1,2,2), 
   groupnames=c("habitat","climate"))

# 绘制方差分解结果
plotVariancePartitioning(m, VP = VP)

# 使用kable函数以表格形式展示Beta参数的方差分解结果
kable(VP$R2T$Beta)

# 输出Y变量的方差分解结果
VP$R2T$Y

# 将模型结果转换为Coda对象，以便进行统计分析
mpost = convertToCodaObject(m)

# 输出Rho参数的统计摘要
summary(mpost$Rho)

########改变先验分布来影响物种负载的模型，
# 并进行相关的统计分析和图形显示
# Changing prior distribution for
# the species loadings
# 定义环境变量公式，这里使用了气候数据的二次多项式形式
XFormula.1 = ~poly(climate, degree = 2, raw = TRUE)

# 设置随机效应层级的先验分布参数
rL = setPriors(rL, a1=5, a2=5)

# 显示随机效应层级的结构
str(rL)

# 创建HMSC模型对象，并使用先前定义的先验分布参数
ma5 = Hmsc(Y=Y, XData=XData, XFormula = XFormula.1,
           TrData = traits, TrFormula = TrFormula,
           phyloTree = phy,
           studyDesign=studyDesign, 
           ranLevels=list(sample=rL))

# 对HMSC模型进行MCMC采样
ma5 = sampleMcmc(ma5, thin = thin, 
   samples = samples, 
   transient = transient,
   nChains = nChains, 
   nParallel = 1, 
   verbose = verbose)

# 更改先验分布参数
rL = HmscRandomLevel(units = studyDesign$sample)
rL = setPriors(rL, a1=500, a2=500)
str(rL)

# 创建新的HMSC模型对象，使用更新的先验分布参数
ma500 = Hmsc(Y=Y, XData=XData, 
    XFormula = XFormula.1,
    TrData = traits, 
    TrFormula = TrFormula,
    phyloTree = phy,
    studyDesign=studyDesign, 
    ranLevels=list(sample=rL))

# 对更新的HMSC模型进行MCMC采样
ma500 = sampleMcmc(ma500, thin = thin, 
    samples = samples, 
    transient = transient,
    nChains = nChains, 
    nParallel = 1, 
    verbose = verbose)

# 设置图形显示参数，准备显示三个关联图
par(mfrow=c(1,3), mar=c(0,0,0,0))

# 计算物种间关联性并绘制关联图，对于不同的先验设置分别显示
# a1 = a2 = 5
OmegaCor = computeAssociations(ma5)
supportLevel = 0.95
toPlot = ((OmegaCor[[1]]$support>supportLevel) 
          + (OmegaCor[[1]]$support<(
            1-supportLevel))>0)*OmegaCor[[1]]$mean
corrplot(toPlot, method = "color", 
         col=colorRampPalette(
            c("blue","white","red"))(200),
         tl.cex=.6, tl.col="black",
         title="a1 = a2 = 5", mar=c(0,0,1,0))

# a1 = a2 = 50
OmegaCor = computeAssociations(ma50)
toPlot = ((OmegaCor[[1]]$support>supportLevel) 
          + (OmegaCor[[1]]$support<(
           1-supportLevel))>0)*OmegaCor[[1]]$mean
corrplot(toPlot, method = "color", 
         col=colorRampPalette(c(
         "blue","white","red"))(200),
         tl.cex=.6, tl.col="black",
         title="a1 = a2 = 50", mar=c(0,0,1,0))

# a1 = a2 = 500
OmegaCor = computeAssociations(ma500)
toPlot = ((OmegaCor[[1]]$support>supportLevel) 
          + (OmegaCor[[1]]$support<(
          1-supportLevel))>0)*OmegaCor[[1]]$mean
corrplot(toPlot, method = "color", 
         col=colorRampPalette(
           c("blue","white","red"))(200),
         tl.cex=.6, tl.col="black",
         title="a1 = a2 = 500", mar=c(0,0,1,0))

注：以上代码为了适配微信公众号显示，有些地方做了换行处理，并不一定合适，希望理解，代码超过屏幕的部分，可以左右划屏阅读。未修改的源代码，随后将在辰山相关平台上提供，请关注本公众号。

原始报告的PPT将在下期共享。

http://mp.weixin.qq.com/s?__biz=Mzg4NTczMzAyNA==&mid=2247485086&idx=1&sn=ef82b3dfcc219bf03b869af7107c0889

数量生态学与R语言

多元统计、一元统计、R程序包开发及R语言应用的推广。

最新文章

phylolm.hp新包发布，用于量化谱系、环境因子对性状变异影响

glmm.hp使用案例（36）| AGEE：中科院生态环境研究中心郑华团队：实证研究量化景观异质性组分及其互作对害虫控制相对贡献

gam.hp使用案例（1）| 曲家鹏团队：高原鼠兔干扰对草地植物群落系统发育的影响

glmm.hp包现在可以允许glm带有offset项，请及时更新

glmm.hp 使用案例（35）| GCB:兰大邓建明团队：中国草地和荒漠土壤无机碳库及其驱动因素

MEE专刊：大语言模型（LLM）如何影响生态学研究：机遇与挑战的多维探讨

glmm.hp 使用案例（34）| NC:南土所梁玉婷团队：冬季变暖对作物生物量碳影响

glmm.hp 使用案例（33）| NC：张福锁院士团队：保护性农业促进土壤健康与生产力以应对长期气候变暖

glmm.hp 使用案例（32）| 杜彦君团队揭示亚热带植物物候爆芽－展叶间隔期的关键驱动因子

南京林业大学生态与环境学院招聘生态学研究相关的人才

glmm.hp使用案例（31） | 1级根解剖性状的海拔变异规律及其适应机制

glmm.hp使用案例(30)| 青海大学董全民课题组: 牦牛和藏羊混合放牧提升了寒草地植物群落功能多样性

glmm.hp包更新及并正确引用

glmm.hp使用案例（29）| 北京林业大学王襄平课题组: 土壤真菌驱动细根相关生长收益随演替变化

9月-12月“AI背景下R语言科学数据分析培训（在线）”（还可以报名）请大家抓紧报名！

JPE关于glmm.hp包的论文入选9月份ESI热点论文（内附glmm.hp使用案例）

9月12日晚开课“AI背景下R语言科学数据分析培训（在线）”（还可以报名）请大家抓紧报名！

2024年9-12月“AI背景下R语言科学数据分析培训（在线）”通知（9月12日晚开课，每周一次，还可以报名）

glmm.hp使用案例（28）| 匈牙利巴拉顿湖沼学研究所冯凯：入侵溪流鱼类群落功能多样性分解的模式及其驱动因素

2024年9-12月“AI背景下R语言科学数据分析培训（在线）”通知（9月12日晚开课，每周一次，显然依然可以报名）

glmm.hp使用案例（27） | 北京大学沈泽昊课题组：气候变暖下中国北方半干旱区主要人工林树种径向生长和抗旱能力评估

2024年9-12月“AI背景下R语言科学数据分析培训（在线）”通知

rdacca.hp包使用描述的参考范例：Ecological Applications最新的一篇文章

2024年9-12月“AI背景下R语言科学数据分析培训（在线）”通知，(优惠期到8月20日）

2024年9-12月“AI背景下R语言科学数据分析培训（在线）”通知，零基础开始，15次课

“大语言模型在生物多样性研究中的应用分析”在线发表

预告：R语言在植物多样性调查、编目中的应用（张金龙）

glmm.hp使用案例（26）| 海南大学周淑荣：生境质量效应驱动西沙群岛植物和土壤微生物群落物种多样性与岛屿面积关系

联合物种分布模型（JSDMs）是什么？

南京林业大学生态与环境学院招聘动物生态学、自然保护地研究相关的人才

glmm.hp使用案例（25）神经科学| 圣保罗联邦大学：脑血流量和呼气末CO2可预测直立不耐受患者在头部倾斜时出现的头晕症状

为什么选用平均分割而不是向前或向后筛选来获取最佳模型和变量重要性?

南京林业大学进化生态学课题组招聘及招生启事

相关分析正负与SEM里面通径系数相反的情况解读

glmm.hp使用案例（24）| 西交利物浦大学：非作物生境与农药暴露对传粉昆虫多样性的影响

@所有人，JPE优秀论文揭晓！

glmm.hp使用案例（23）| 西北高原生物研究所：公路距离对青藏公路沿线植物群落多样性的影响

《联合物种分布模型原理与实践》- 谷际岐博士报告资料共享（讲义）

使用gam.hp包进行广义可加模型（GAM）解释变量相对重要性的评估

《联合物种分布模型原理与实践》- 谷际岐博士报告资料共享（视频及R代码）

MEE的最新影响因子为6.3（IF5为8.9)，生态学科排名12/195

glmm.hp使用案例（22）| 植物研究所：根系渗出参与温带草原割草时氮转化的调控作用

MEE的最新CiteScore为11.6，位居学科前5%

MEE:大型语言模型（LLMs）在生态学和进化研究中编程、教学和包容性方面的应用(全文）

glmm.hp使用案例（21）| 东北师范大学：西北古尔班通古特沙漠沙漠夜行性气孔行为及其对荒漠草本水分利用策略的影响

Ecology最新综述：统计生态学百年历史回顾（全文）

数据生态学百年：统计生态学的发展与未来

glmm.hp包5月14更新，解决一个带NA原始数据的bug，请大家及时更新并使用

MEE和JPE的文章继续入选热点论文

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉