鉴于此,中国科学院青藏高原研究所环境变化与多圈层过程团队张国庆研究员联合德国、美国和中国香港等地区的科学家,提出一种基于深度学习的冰湖自动提取方法。该方法综合评估了Deeplabv3+和U-Net两种经典解码器,结合Mobilenetv2、Mobilenetv3、Resnet50和Xception四种不同编码器,在青藏高原及周边地区进行冰湖制图的训练和验证(图1)。研究最终选择了以Mobilenetv3为核心的Deeplabv3+框架,通过数据预处理(水体指数计算、冰湖密度计算、线性归一化、数据增强等)最大化利用输入数据,成功实现学习数据间的复杂非线性关系,并通过核密度估计方法优化冰湖边界参数——冰湖概率阈值,生成冰湖数据产品(图2)。
该研究克服了传统方法在高山冰湖制图中的局限性,尤其是在阴影、冰雪覆盖及水体浑浊等干扰条件下依然能够较准确识别冰湖边界(图3)。对于青藏高原及周边地区,该模型成功识别了2020年大于0.0054km2的冰湖29429个,总面积约1779.9km2(图4);在冰湖提取方面精度达到86%,召回率85%,F1分数为85%。为进一步验证模型的迁移能力,研究团队还在南北美洲高山地区和格陵兰极地地区进行了测试,结果显示,模型具有较强的迁移性。该研究方法为全球尺度的冰湖制图提供了技术框架,为大尺度冰湖水文和冰湖溃决洪水风险评估提供了重要支持。
研究成果以“Automatic extraction of glacial lakes from Landsat imagery using deep learning across the Third Pole region”为题,在国际学术期刊《Remote Sensing of Environment》上发表。兰州大学联合培养博士生唐倩为论文第一作者,青藏高原研究所张国庆研究员为通讯作者,该研究得到第二次青藏高原综合科学考察研究和国家自然科学基金委青藏高原地球系统基础科学中心等项目支持。
https://doi.org/10.1016/j.rse.2024.114413
图1 训练和验证数据的时空分布
橙色方框代表训练场景,蓝色方框代表验证场景。圆圈的大小表示图像块的数量,圆圈的颜色表示图像块的月份。训练图像块与验证图像块的比例为7:3。右上角插图显示了北美洲、南美洲和格陵兰的位置,用于测试模型在空间上的迁移性。
图2 深度学习算法冰湖提取流程图
首先是数据预处理,得到512×512的训练图像块,作为深度卷积神经网络的输入;其次是模型训练,生成一个逐像素的概率栅格图像;再是后处理,以生成最终的冰湖产品;最后是精度验证,通过三种方法对提取的冰湖进行综合评估:混淆矩阵、相关性分析和交并比。
图3 模型在不同干扰条件下的提取性能
a) 阴影遮挡,b) 湖冰覆盖,c) 冰川相接,d) 河流相连,e) 提取的冰湖边界。
图4 使用发展的方法提取的2020年青藏高原及周边地区冰湖
a-p)表示青藏高原及周边地区区域冰湖海拔分布,q)表示基于1°×1°网格的冰湖数量和面积特征,其中圆圈的大小表示数量,颜色表示面积。