PNAS | 检测2000多种植物分布! 使用遥感和深度学习监测和预测植物物种分布和快速变化, 结合公民科学数据

文摘   2024-10-23 09:02   荷兰  

 RS   DL 

论文介绍

题目:Deep learning models map rapid plant species changes from citizen science and remote sensing data

期刊:Proceedings of the National Academy of Sciences

论文:https://www.pnas.org/doi/10.1073/pnas.2318296121

代码:https://github.com/moiexpositoalonsolab/deepbiosphere

年份:2024
单位:Department of Plant Biology, Carnegie Science, Stanford 等

创新点

  • 基于深度学习的植物物种变化监测:该研究开发了一个名为“Deepbiosphere”的深度学习模型,整合了公民科学数据与遥感影像,能够在高空间分辨率下(1米)检测2000多种植物的分布。
  • 结合遥感和气候数据:创新性地将气候数据(Bioclim变量)与遥感数据结合,通过多层感知器(MLP)和残差卷积神经网络(TResNet)的多头架构,显著提升了物种分布模型(SDM)的预测精度。
  • 抗噪能力和偏差修正:模型针对公民科学数据的噪声和系统性观测偏差,设计了“采样偏差感知的二元交叉熵损失函数”,显著提高了模型在稀有物种上的表现。
  • 自动化空间与时间变化检测:该方法可以自动识别植物群落的快速变化,例如火灾后植物群落的动态变化。

背景

  • 全球植物多样性面临威胁:人类活动和气候变化导致植物物种的分布发生显著变化,并威胁其生态系统功能。

  • 植物物种监测的挑战:现有监测方法难以在高分辨率下精确追踪植物物种的动态变化。

  • 深度学习和遥感技术的潜力:深度学习结合遥感数据可以实现高效的自动化物种分布监测。

  • 公民科学的贡献:公民科学数据为物种监测提供了丰富的观测样本,有助于提升监测覆盖率和数据质量。

数据

1. 公民科学数据(Citizen Science Data)

  • 来源:主要来自iNaturalist平台以及全球生物多样性信息设施(GBIF)。
  • 数量:研究收集了超过65万条植物物种的观测数据,覆盖2221种植物。
  • 时间范围:2015年至2022年的观测数据。
  • 处理方式:
    • 过滤掉了重复观测、地理坐标不准确和过度采样区域的数据。
    • 通过邻居插补(neighbor imputation)增加了每个物种的观测密度,将重叠的256米范围内的物种添加到某个观测点中。
    • 最终筛选后,得到了65万条、涵盖2221种植物的有效观测数据。

2. 遥感数据(Remote Sensing Data)

  • 来源:美国国家农业影像计划(NAIP)的航空影像。
  • 时间:2012年和2014年的遥感影像。
  • 分辨率:1米分辨率的RGB和近红外影像,影像大小为256×256像素(约等于256米×256米的区域)。
  • 数据特点:
    • 影像数据与物种的地理坐标进行匹配,使得每个物种的观测点位于影像的中心。
    • 数据涵盖了加利福尼亚州的大部分地区,为植物物种的精细空间分布预测提供了支持。

3. 气候数据(Climate Data)

  • 来源:WorldClim 2.0。
  • 气候变量:19个生物气候变量,主要包括降水和温度数据,这些变量具有生物学上的相关性。
  • 时间范围:1970年至2000年之间的气候数据,数据是基于多年平均值。
  • 分辨率:约1公里的空间分辨率。

4. 数据集成与处理

  • 邻居插补(Neighbor Imputation):研究通过将邻近观测点的其他物种插补到当前观测点中,增强了每个观测点的数据丰富度,尤其对于稀有物种,这种方式可以提高模型的泛化能力。

  • 训练和测试数据划分:研究将数据分为训练集和测试集,并采用了空间交叉验证方式,以确保模型在未观测区域的泛化能力。为了避免空间自相关的影响,测试集中所有观测点与训练集中的观测点必须保持至少1300米的距离。

方法

模型设计

  • 残差卷积神经网络(CNN):

    • 研究使用了TResNet,TResNet是一种专为图像分类任务优化的深度残差卷积神经网络,能够高效处理遥感影像数据。

    • 为了提升模型的分类能力,研究在网络的输出层中增加了三个全连接层,分别用于预测植物的科、属和种。

    • 通过预测不同分类层次(科、属、种)来共享信息,提升对物种的预测效果,尤其是稀有物种。
  • 多层感知器(MLP):

    • 为了整合气候数据,文章设计了一个多层感知器(MLP)网络,单独处理气候数据。该网络主要用于从19个气候变量中提取植物分布的相关特征。
  • Deepbiosphere模型(组合架构):

    • 将TResNet和MLP组合成一个多头神经网络架构,称为Deepbiosphere。

    • TResNet处理遥感影像,MLP处理气候数据,两者的输出共同用于预测植物物种的存在与分布。

    • 这种多模态架构使模型能够同时利用气候和遥感数据,从而提升对物种分布的综合预测能力。


抗噪声与偏差处理

采样偏差感知的二元交叉熵损失函数:
    • 公民科学数据往往存在采样偏差,常见物种和在人口稠密地区的物种观测较多,而稀有物种或偏远地区的观测较少。为了减轻这种偏差,研究者设计了一种“采样偏差感知的二元交叉熵损失函数”。

    • 该损失函数根据每个位置的物种缺失程度,适当降低未观测到物种的负样本权重,从而减小偏差的影响。

    • 该损失函数提高了模型在稀有物种上的表现。


模型训练

训练集与测试集划分:数据集通过空间交叉验证进行训练和测试,以确保模型能够在未观测到的区域进行泛化。具体而言,使用10折交叉验证,并确保每个观测点与其最近的训练点保持1300米的距离。

结果和精度

  • 高精度物种预测:Deepbiosphere在加利福尼亚州的植物物种分布预测上表现优异,AUC-ROC均值达到了0.95,显著超越了传统的物种分布模型(如Maxent),特别是在复杂栖息地(如红杉林地)中,对稀有和常见物种均表现出高精度预测。
  • 生态系统变化的时间监测:模型能够有效检测生态系统的动态变化,如2013年Rim Fire森林火灾后植物群落的恢复。通过对比火灾前后遥感影像,模型揭示了社区结构的显著变化,特别是在火灾严重影响区域,物种分布的时间变化预测与传统火灾严重度指数(dNBR)高度相关。
  • 空间变化预测:Deepbiosphere模型在空间上也展现了对植物物种变化的灵敏度,能够识别破碎化栖息地中的细微物种变化。通过计算多个物种的空间社区变化,模型显示出优于传统方法的预测能力,尤其是在复杂环境中的物种迁移和分布变化。
  • 稀有物种和栖息地的外推能力:通过空间交叉验证,Deepbiosphere展示了良好的泛化能力,不仅可以在已观测区域表现出色,还能够外推到未观测区域,并对稀有物种的预测也有较好的效果,减轻了传统模型因数据不平衡带来的问题。


精度对比

可视化

图2展示了Deepbiosphere模型对沿海红杉森林(Sequoia sempervirens)的预测结果

  • A:加利福尼亚红杉国家公园Tall Trees红杉树林的NAIP航空影像,显示了老红杉遗迹。

  • B:基于人工注释的红杉林覆盖图,区分了成熟和年轻的红杉林。

  • C:Deepbiosphere模型预测红杉的分布情况,包括成熟和再生林。

  • D:美国国家公园管理局的植被图,标注了成熟红杉林(深红色)和再生红杉林(蓝色)。

  • E:Deepbiosphere对两种红杉林下层植物物种的预测,分别是喜好成熟红杉林的Oxalis oregana和喜好次生林的Rubus ursinus。

图3展示了Deepbiosphere模型检测生态系统在空间和时间上的社区变化

  • A:北部Marin县的NAIP航空影像,显示了栖息地的破碎化。

  • B:使用Deepbiosphere模型计算的空间社区变化,基于221个植物物种的预测。

  • C:对比基于细尺度植被类型与Deepbiosphere的空间社区变化预测。

  • D:对比NAIP原始影像的边缘检测与细尺度植被类型的独特性。

  • E:2013年Rim Fire森林火灾后的NAIP影像。

  • F:Deepbiosphere计算的时间社区变化,比较2012年和2014年的物种预测。

  • G:与基于火灾严重程度的dNBR(归一化火烧指数差异)对比。

  • H:2012年和2014年NAIP原始影像计算的欧几里得距离与dNBR对比。

更多图表分析可见原文



欢迎关注会议论文赏读系列

因配置了AI回复功能,除关键词自动回复外,号内信息主要由AI大模型回复。如需资源、投稿、合作等,请直接联系小助手微信(添加请备注:咨询投稿合作加群,加群需备注姓名/昵称,单位和研究方向)。


公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!




问题及讨论可直接在文章下方留言


相关链接:


论文 | RSE | 跨年度农作物制图更新框架CROPUP, 端到端, 无需现场样本
论文赏读 | ISPRS | 农作物分类制图, 使用PlanetScope 影像和SAM模型, 并结合谷歌街景视图数据
论文赏读 | ISPRS | 大尺度农作物制图基于自监督, Transformer和时序数据
论文赏读 | CVPR24 | 多模态学习用于遥感植被状态预测 (NDVI预测)

  欢迎关注  


分享遥感与深度学习领域的技术、论文、书籍、新鲜事。



欢迎加入遥感与深度学习交流群(点此加入)


遥感与深度学习
聚焦遥感与深度学习,分享相关技术、论文、书籍、资讯,团队来自国内外著名期刊作者及审稿人
 最新文章