RS DL
论文介绍
题目:Deep learning models map rapid plant species changes from citizen science and remote sensing data
期刊:Proceedings of the National Academy of Sciences
论文:https://www.pnas.org/doi/10.1073/pnas.2318296121
代码:https://github.com/moiexpositoalonsolab/deepbiosphere
创新点
基于深度学习的植物物种变化监测:该研究开发了一个名为“Deepbiosphere”的深度学习模型,整合了公民科学数据与遥感影像,能够在高空间分辨率下(1米)检测2000多种植物的分布。 结合遥感和气候数据:创新性地将气候数据(Bioclim变量)与遥感数据结合,通过多层感知器(MLP)和残差卷积神经网络(TResNet)的多头架构,显著提升了物种分布模型(SDM)的预测精度。 抗噪能力和偏差修正:模型针对公民科学数据的噪声和系统性观测偏差,设计了“采样偏差感知的二元交叉熵损失函数”,显著提高了模型在稀有物种上的表现。 自动化空间与时间变化检测:该方法可以自动识别植物群落的快速变化,例如火灾后植物群落的动态变化。
背景
全球植物多样性面临威胁:人类活动和气候变化导致植物物种的分布发生显著变化,并威胁其生态系统功能。
植物物种监测的挑战:现有监测方法难以在高分辨率下精确追踪植物物种的动态变化。
深度学习和遥感技术的潜力:深度学习结合遥感数据可以实现高效的自动化物种分布监测。
公民科学的贡献:公民科学数据为物种监测提供了丰富的观测样本,有助于提升监测覆盖率和数据质量。
数据
1. 公民科学数据(Citizen Science Data)
来源:主要来自iNaturalist平台以及全球生物多样性信息设施(GBIF)。 数量:研究收集了超过65万条植物物种的观测数据,覆盖2221种植物。 时间范围:2015年至2022年的观测数据。 处理方式:
过滤掉了重复观测、地理坐标不准确和过度采样区域的数据。 通过邻居插补(neighbor imputation)增加了每个物种的观测密度,将重叠的256米范围内的物种添加到某个观测点中。 最终筛选后,得到了65万条、涵盖2221种植物的有效观测数据。
2. 遥感数据(Remote Sensing Data)
来源:美国国家农业影像计划(NAIP)的航空影像。 时间:2012年和2014年的遥感影像。 分辨率:1米分辨率的RGB和近红外影像,影像大小为256×256像素(约等于256米×256米的区域)。 数据特点:
影像数据与物种的地理坐标进行匹配,使得每个物种的观测点位于影像的中心。 数据涵盖了加利福尼亚州的大部分地区,为植物物种的精细空间分布预测提供了支持。
3. 气候数据(Climate Data)
来源:WorldClim 2.0。 气候变量:19个生物气候变量,主要包括降水和温度数据,这些变量具有生物学上的相关性。 时间范围:1970年至2000年之间的气候数据,数据是基于多年平均值。 分辨率:约1公里的空间分辨率。
4. 数据集成与处理
邻居插补(Neighbor Imputation):研究通过将邻近观测点的其他物种插补到当前观测点中,增强了每个观测点的数据丰富度,尤其对于稀有物种,这种方式可以提高模型的泛化能力。
训练和测试数据划分:研究将数据分为训练集和测试集,并采用了空间交叉验证方式,以确保模型在未观测区域的泛化能力。为了避免空间自相关的影响,测试集中所有观测点与训练集中的观测点必须保持至少1300米的距离。
方法
模型设计
残差卷积神经网络(CNN):
研究使用了TResNet,TResNet是一种专为图像分类任务优化的深度残差卷积神经网络,能够高效处理遥感影像数据。
为了提升模型的分类能力,研究在网络的输出层中增加了三个全连接层,分别用于预测植物的科、属和种。
通过预测不同分类层次(科、属、种)来共享信息,提升对物种的预测效果,尤其是稀有物种。 多层感知器(MLP):
为了整合气候数据,文章设计了一个多层感知器(MLP)网络,单独处理气候数据。该网络主要用于从19个气候变量中提取植物分布的相关特征。 Deepbiosphere模型(组合架构):
将TResNet和MLP组合成一个多头神经网络架构,称为Deepbiosphere。
TResNet处理遥感影像,MLP处理气候数据,两者的输出共同用于预测植物物种的存在与分布。
这种多模态架构使模型能够同时利用气候和遥感数据,从而提升对物种分布的综合预测能力。
抗噪声与偏差处理
公民科学数据往往存在采样偏差,常见物种和在人口稠密地区的物种观测较多,而稀有物种或偏远地区的观测较少。为了减轻这种偏差,研究者设计了一种“采样偏差感知的二元交叉熵损失函数”。
该损失函数根据每个位置的物种缺失程度,适当降低未观测到物种的负样本权重,从而减小偏差的影响。
该损失函数提高了模型在稀有物种上的表现。
模型训练
训练集与测试集划分:数据集通过空间交叉验证进行训练和测试,以确保模型能够在未观测到的区域进行泛化。具体而言,使用10折交叉验证,并确保每个观测点与其最近的训练点保持1300米的距离。
结果和精度
高精度物种预测:Deepbiosphere在加利福尼亚州的植物物种分布预测上表现优异,AUC-ROC均值达到了0.95,显著超越了传统的物种分布模型(如Maxent),特别是在复杂栖息地(如红杉林地)中,对稀有和常见物种均表现出高精度预测。 生态系统变化的时间监测:模型能够有效检测生态系统的动态变化,如2013年Rim Fire森林火灾后植物群落的恢复。通过对比火灾前后遥感影像,模型揭示了社区结构的显著变化,特别是在火灾严重影响区域,物种分布的时间变化预测与传统火灾严重度指数(dNBR)高度相关。 空间变化预测:Deepbiosphere模型在空间上也展现了对植物物种变化的灵敏度,能够识别破碎化栖息地中的细微物种变化。通过计算多个物种的空间社区变化,模型显示出优于传统方法的预测能力,尤其是在复杂环境中的物种迁移和分布变化。 稀有物种和栖息地的外推能力:通过空间交叉验证,Deepbiosphere展示了良好的泛化能力,不仅可以在已观测区域表现出色,还能够外推到未观测区域,并对稀有物种的预测也有较好的效果,减轻了传统模型因数据不平衡带来的问题。
精度对比
可视化
图2展示了Deepbiosphere模型对沿海红杉森林(Sequoia sempervirens)的预测结果
A:加利福尼亚红杉国家公园Tall Trees红杉树林的NAIP航空影像,显示了老红杉遗迹。
B:基于人工注释的红杉林覆盖图,区分了成熟和年轻的红杉林。
C:Deepbiosphere模型预测红杉的分布情况,包括成熟和再生林。
D:美国国家公园管理局的植被图,标注了成熟红杉林(深红色)和再生红杉林(蓝色)。
E:Deepbiosphere对两种红杉林下层植物物种的预测,分别是喜好成熟红杉林的Oxalis oregana和喜好次生林的Rubus ursinus。
图3展示了Deepbiosphere模型检测生态系统在空间和时间上的社区变化
A:北部Marin县的NAIP航空影像,显示了栖息地的破碎化。
B:使用Deepbiosphere模型计算的空间社区变化,基于221个植物物种的预测。
C:对比基于细尺度植被类型与Deepbiosphere的空间社区变化预测。
D:对比NAIP原始影像的边缘检测与细尺度植被类型的独特性。
E:2013年Rim Fire森林火灾后的NAIP影像。
F:Deepbiosphere计算的时间社区变化,比较2012年和2014年的物种预测。
G:与基于火灾严重程度的dNBR(归一化火烧指数差异)对比。
H:2012年和2014年NAIP原始影像计算的欧几里得距离与dNBR对比。
更多图表分析可见原文
因配置了AI回复功能,除关键词自动回复外,号内信息主要由AI大模型回复。如需资源、投稿、合作等,请直接联系小助手微信(添加请备注:咨询、投稿、合作、加群,加群需备注姓名/昵称,单位和研究方向)。
公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!
问题及讨论可直接在文章下方留言
相关链接:
欢迎关注
分享遥感与深度学习领域的技术、论文、书籍、新鲜事。
欢迎加入遥感与深度学习交流群(点此加入)。