全球首发!中山大学携手中科大、武大推出全球首个跨域泛化的遥感大模型!

学术   2024-11-08 14:43   湖南  


  第一时间获取气象科研资讯

气象学家公众号交流群

加入


全球首发!中山大学携手中科大、武大推出全球首个跨域泛化的遥感大模型!

近日,中山大学研究团队携手中国科学技术大学和武汉大学sigma实验室,共同推出全球首个专注于遥感跨域泛化的语义分割视觉大模型CrossEarth (后续称为基础模型)。


文章链接:https://arxiv.org/abs/2410.22629v2

•项目主页:https://cuzyoung.github.io/CrossEarth-Homepage/

•项目代码:https://github.com/Cuzyoung/CrossEarth/

该研究深入探讨了遥感领域跨域泛化的关键性,针对该领域研究的空白点,提出了一套统一的评价指标体系,并给出了创新的解决方案。

CrossEarth模型的问世,标志着遥感跨域泛化研究迈入新纪元,为相关领域的技术进步和应用拓展提供了坚实基础。

研究背景与动机:

跨域泛化(Cross-Domain Generalization)作为机器学习的关键技术之一,要求模型能够无需额外训练,直接在未知场景中应用。在遥感技术中,这一能力尤为重要。例如,在灾后评估中,灾害的不可预测性要求模型具备快速部署的能力,从而节省时间和成本。此外,一个具有高泛化性的模型,理论上能够将基于某一地区数据训练的模型直接应用于全球任何地区的类似任务。

尽管如此,遥感领域的跨域泛化研究仍处于起步阶段,相关研究稀缺。并且遥感数据的多样性,比如分辨率,波段,以及地区等等因素,也导致泛化难以实现。文章认为,深度学习中的基础模型概念——即通过大量数据训练并广泛应用于多种场景——与跨域泛化的目标不谋而合。因此,文章团队提出构建全球首个跨域泛化的视觉基础模型,以语义分割为例,旨在推动遥感跨域泛化发展,并为未来的研究提供坚实的基线模型。

主要贡献:

(1)基准集构建:在遥感领域,跨域泛化技术的发展尚处于起步阶段,缺乏统一的数据集和评估标准。为了填补这一空白,文章团队构建了该领域的首个基准集,为后续研究提供了标准化的测试平台。

(2)CrossEarth模型:文章团队开发了首个跨域泛化语义分割的视觉基础模型CrossEarth,其卓越的泛化能力远超现有模型,能够适应各种现实场景下的语义分割任务。

CrossEarth基准集的构建细节:

(1)文章精选并整合了多个广泛使用的遥感语义分割数据集,包括ISPRS Potsdam和Vaihingen、RescueNet、LoveDA、WHU Building、DeepGlobe、Massachusetts和CASID,确保了基准集的广泛性和适用性。

(2)领域差异设置:该基准测试集合涵盖了70k张遥感影像,28个语义分割任务,涉及5个主要领域差异,包括未见区域、未见光谱带、区域与光谱带的组合、区域与平台的组合以及区域与气候的组合。这些设置旨在解决模型在现实世界中可能遇到的跨领域泛化挑战。

(3)特定应用场景构建:文章针对特定的应用场景,如灾害评估(Potsdam和RescueNet)、建筑提取(WHU Building)和道路检测(DeepGlobe和Massachusetts),构建了专门的基准测试,以评估模型在实际应用中的泛化性能。

CrossEarth模型架构与训练策略设计:

(1)在数据层面,文章创新性地提出来地球风格注入技术,通过高效丰富的数据增强,扩展训练数据的分布,以覆盖更多未知区域。

(2)在模型层面,CrossEarth采用了多任务学习框架,以DINO-V2作为骨干网络,结合语义分割和掩码重建任务进行联合训练,从而提升模型对跨域变化的适应能力。

更多技术细节,敬请查阅CrossEarth的原文。

CrossEarth实际应用效果展示: 

所有的GT Label代表真实标签,即标准答案;CrossEarth代表文章模型的预测效果。 

(1)道路检测示例:

(2)建筑物提取示例: 

(3)灾后地区分割示例: 

最后,作者团队总结了一些CrossEarth的应用前景,以供后续研究人员参考:

1.常规的规划分析场景

CrossEarth模型以其出色的跨域泛化能力,能够在无需针对特定区域重新训练的情况下,直接应用于新的地区或场景。这意味着,无论是城市扩张监测、农业土地覆盖变化分析,还是生态保护区的环境评估,CrossEarth都能提供快速、准确的分割结果,极大地提高了遥感数据的分析效率和应用范围。

2.道路提取场景

在城市规划和交通管理中,道路提取是一个关键任务。CrossEarth模型能够适应不同分辨率、不同光谱带的道路图像,提供高精度的道路提取结果。这使得城市规划者和交通管理部门能够快速获得道路网络的详细信息,用于交通流量分析、道路规划和维护决策。此外,CrossEarth的泛化能力也意味着在新开发区域或城市化迅速发展的地区,无需大量标注数据,即可实现道路的快速提取和更新。

3.灾害监测场景

灾害监测是遥感技术的重要应用之一。CrossEarth可以被应用到不同地区、不同气候条件下,快速部署并提供准确的灾害监测结果。例如,在雪灾、洪水、地震或森林火灾等灾害发生后,借助强悍的泛化能力,CrossEarth能够迅速分析遥感图像,识别受灾区域,为救援行动提供关键信息。这种能力不仅提高了灾害响应的速度,还有助于优化资源分配和救援计划的制定。

4.灾后评估场景 

灾后评估是救援工作的重要组成部分。CrossEarth模型能够快速分析灾后地区的遥感图像,评估灾害影响,如基础设施、建筑物损毁情况等。这些信息对于救援队伍制定救援路线、确定救援优先级至关重要。CrossEarth的泛化能力确保了在缺乏当地数据的情况下,依然能够提供准确的评估结果,极大地提高了灾后评估的效率和准确性。

结论

CrossEarth模型的跨域泛化能力,不仅推动了遥感技术在语义分割领域的进步,也为道路提取、灾害监测和灾后评估等应用提供了强大的技术支持。随着技术的不断发展和完善,其有望在未来的遥感应用中发挥更大的作用,为全球环境监测和灾害管理提供更加精准和高效的解决方案。





声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编(微信:qxxjgzh)处理。


往期推荐
 获取ERA5/ERA5-Land再分析数据(36TB/32TB)
 获取全球GPM降水数据,半小时/逐日(4TB)
 获取1998-2019 TRMM 3B42逐日降水数据
 获取最新版本CMIP6降尺度数据集30TB
 EC数据商店推出Python在线处理工具箱
★ EC打造实用气象Python工具Metview
★ 机器学习简介及在短临天气预警中的应用
★ Nature-地球系统科学领域的深度学习及理解
★ 灵魂拷问:ChatGPT对气象人的饭碗是福是祸?
★ 气象局是做啥的?气象局的薪水多少?


气象学家
【气象学家】公众号平台为您把握最新AI4Science、解读最新气象科研进展、分享气象实用编程技巧、追踪气象即时资讯。致力于提升我国天气和气候预报、预测水平。欢迎加入气象AI和气象行业交流群以及气象博士群!与12W+专业人士一起交流互动!
 最新文章