全球草地范围与类型(2000-2022)的时空机器学习地图:全新高精度数据集发布
《Scientific Data》,是《Nature》旗下的一本开放获取(Open Access)的学术期刊,专注于发表高质量的数据描述性文章(Data Descriptors)。这些文章旨在提供详细的科学数据集和其产生、处理的背景信息,以促进数据的共享和重用。
《Scientific Data》涵盖的领域非常广泛,包括生命科学、物理科学、社会科学等。该期刊的主要目的是提高科学数据的透明度和可重复性,支持开放科学和数据共享的理念。
英文题目:Annual 30-m maps of global grassland class and extent (2000–2022) based on spatiotemporal Machine Learning
中文译名:基于时空机器学习的全球草地类别和范围年度 30 米地图(2000-2022 年)
发布时间:2024年12月11日
发表期刊:Scientific Data
第一作者:Leandro Parente et al
第一单位:OpenGeoHub 基金会,荷兰
DOI:10.1038/s41597-024-04139-6
草地生态系统在全球生物多样性、碳储存和生态功能中扮演着重要角色。了解草地的分布、变化及其驱动因素对于制定有效的土地管理政策至关重要。然而,现有的全球草地数据通常存在空间分辨率不足和时间动态更新滞后的问题。该研究发布了一个基于时空机器学习技术的全球草地年度地图数据集,涵盖2000至2022年间,分辨率达到30米,旨在提供更加精细和动态的草地变化信息。
研究通过结合遥感影像、气候数据、地形信息等多种因素,利用时空机器学习(随机森林)方法,生成了全球范围内草地(包括农耕草地和自然/半自然草地)的年际分布数据。该数据集为土地覆盖变化、草地利用变化等领域的研究提供了一个高精度、动态更新的基础数据资源。
本研究基于Landsat影像和时空机器学习方法,成功生成了2000至2022年间全球草地类别及范围的年际地图,空间分辨率为30米。该数据集不仅提供了草地的空间分布,还区分了农耕草地与自然/半自然草地类别。
通过超过230万个参考样本的视觉解译,研究使用自定义概率阈值(基于五折空间交叉验证)来计算分类精度,获得了较高的F1分数:农耕草地为0.64,自然/半自然草地为0.75,验证了时空机器学习方法的有效性。
该草地数据集(约4TB)以云优化GeoTIFF和Google Earth Engine资产的形式开放共享。数据集的潜在应用包括与其他土地覆盖数据集的集成、追踪草地转为农耕用地的变化以及分析自然/半自然草地转变的驱动因素。
本文中介绍的所有工作流程均使用 Python 实现,源代码可公开获取(MIT 许可证):
https://github.com/wri/global-pasture-watch.
为了实现可重复性,我们在Zenodo中存档了源代码(版本 ggc30m_v1):
(https://doi.org/10.5281/zenodo.1395286781);
所有参考样本
(https://doi.org/10.5281/zenodo.1403545782);
训练模型:
(https://doi.org/10.5281/zenodo.1395280683)。
本研究展示了如何通过时空机器学习方法,结合遥感和气候数据,构建全球高分辨率的草地分布和类型地图。该数据集具有重要的应用潜力,尤其是在土地使用变化、草地保护及生态恢复等领域。借助这些精确的草地数据,研究人员和政策制定者可以更加深入地理解全球草地生态系统的动态变化及其驱动机制。
此外,数据集的开放获取和可重复性源码的提供,使得该研究成果具备了广泛的科研与应用前景。无论是在学术研究、政策评估,还是在全球生态监测等方面,均可为相关领域提供宝贵的数据支持。
图1. 全球牧场监测草原测绘框架包括一般处理工作流程、关键输入和输出以及反馈回路,以改进全球地图的未来版本。
图2. 具有可用信息的图块的空间分布(单个、2年或更长时间)以及原始解释和转换为点的示例,用于训练预测模型。
图3. 2000年和2022年全球草原地图,包括人工和天然/半天然草原的主要类别和概率。
图4. 根据我们的全局随机森林(RF)模型,最重要的15个特征为:(a)人工草地,和(b)天然/半天然草地。
图5. 草地类别的独立验证。
图6. 草地类别的独立验证结果。
图7. 草地稳定性指数估算。
图8. 比较Ramankutty等人制作的牧场分布图、基于HILDA+数据集的1公里分辨率土地覆盖类别以及我们对30米分辨率耕地和天然/半天然草地的预测。
图9. 预测以下国家/地区的人工草地和天然/半天然草地概率的示例:(A)巴拉圭、(B)苏格兰-英国、(C)刚果民主共和国-刚果民主共和国、(D)哈萨克斯坦和(E)澳大利亚。
图10. 巴西(帕拉州里奥玛丽亚)森林砍伐区2000年、2019年和2022年的耕地草地概率(30米空间分辨率)(下图),与ESRI Wayback的超高分辨率图像(上图)进行比较。
图11. 未来全球牧场监测将应用于所制作的草地概率图。
表1. 特征空间覆盖采样(FSCS)的输入层。
表2. 参考标记协议中使用的视觉解释标准。
表3. 使用2,122,357个点样本通过五重空间阻塞交叉验证得出的ML算法比较。
表4. 使用2,122,357个点样本通过五重空间阻塞交叉验证估算的最终随机森林模型的准确度矩阵。
表5. 与我们的分类法相协调的现有参考样本数据集。
表6. 目前全球草原地图中发现的问题和限制。
E N D
获取方式:关注我们的微信公众“地学韦丰吉司长”。后台回复关键字“20241213-1”,即可直接获取原文PDF。(提示:关键字要完整)
免责申明
本推送文章(数据)来源于公开渠道,我们已注明相关信息来源,版权归原作者或出处所有。本推文仅用于学术交流和信息分享。欢迎广大学者们转发本号发布的内容,可留言或后台私信韦丰小编进行授权,转载请注明出处,侵删。