Geo for Good 是谷歌每年举办的峰会,汇集了谷歌 GEE 相关工具的用户,2024 年度会议于 10 月举行。
会上,Google 发布了 EO 领域一项新技术——Embedding Field,暂且翻译为“嵌入场”。
「Embedding Field」 是一个强大的工具,能够加速地理信息数据的映射与监测工作流程。它结合了多源时空数据,使用自监督学习生成一个低维表示空间,用以简化对复杂数据的分析和解读。
那么,什么是 「Embedding Field」?这项技术又是如何工作的呢?让我们一步步拆解。
嵌入向量:从高维到低维的压缩
要理解「Embedding Field」的概念,首先需要了解「Embedding」。
在机器学习中,「Embedding」是一组用来表示数据点的坐标,通常位于一个高维的特征空间中。这个高维空间可能包含了大量来自不同数据源的特征,比如不同时间点、传感器或空间位置的数据。
这个多维空间是由数据本身的特征组成的,例如在地理数据中,每个像素点可能都对应着一个高维度的特征(例如地形、气候、植被等)。
Google 的Embedding Field 「则通过将这些数据压缩到」 64 维「的嵌入向量中,保留了传感器之间的“关键共同信息”。每一个位置对应一个嵌入向量,最终形成一个由这些嵌入向量组成的」二维网格,这就是嵌入场的基本结构。
可以看作是一个由嵌入向量组成的二维网格,每个点对应一个 Embedding,形成一个包含大量信息的图像。这就好像我们给地球表面每个像素点附加了一个“数据压缩包”,这个压缩包能够帮助我们用更少的维度描述更复杂的情况。
多源数据融合:Sentinel、Landsat 与其他
在「Embedding Field」的创建过程中,Google 使用了多个地球观测数据源,包括「Sentinel-1、Sentinel-2、Landsat 8/9」等。这些传感器捕捉到了不同类型的数据,覆盖了地表的不同物理特性。例如:
「Sentinel-1」:主要获取雷达成像数据,能够穿透云层,适用于全球范围的地表动态监测。
「Sentinel-2」:获取多光谱数据,特别适用于植被监测和农业分析。
「Landsat」:以更长的历史记录和全球覆盖著称,能够提供地球表面的长期变化数据。
此外,Google 还融合了其他数据源,如GEDI(全球生态系统动态调查),以及ERA5-Land(再分析气候数据)和GLO-30地形数据。通过这些多源数据,模型能够在同一嵌入空间中捕捉不同传感器之间的“共识”信息。
这种多传感器的融合带来了强大的优势:
「数据互补」:不同传感器捕捉到的特征可以互为补充。例如,光学传感器受限于天气和光照条件,而雷达传感器则可以在各种天气下工作。
「时空多样性」:通过时间和空间上的数据融合,模型能够识别出长期趋势和短期变化的独特模式。
Embedding Field Model 构建
与传统的分类模型不同,Embedding Field 采用的是一种「自监督学习」方法,也就是说,在生成这个特征空间的过程中「没有使用标签」。取而代之,模型从多个传感器输入数据并尝试“重构”目标图像。
❝❞
「输入源」:模型从多个传感器(如 Sentinel-1、Sentinel-2、Landsat 等)获取时序图像,并通过编码器进行「特征提取」。
「Embedding Field Space」:这些提取的特征被压缩为一个** 64 维嵌入空间**,这个空间中的每个维度都保留了重要的信息。
「重构目标」:模型尝试重建不同来源的数据,包括未见过的图像和目标传感器的数据。
这种架构允许模型通过多视角的融合来创建一个更加一致和信息丰富的“真相”表示,即从不同的传感器和时序数据中提取共同的地理信息。
Embedding Field 是什么样的
模型输出的 64 维 Embedding 可以通过降维技术(如 PCA)进行可视化,将其中的几个维度显示为 RGB 图像。这种可视化方式不仅揭示了嵌入向量空间中的相似性,还展示了自动分类和模式识别的潜力。
例如,不同颜色的相似像素代表它们在嵌入空间中的接近程度,某些地理特征如城市、农田等在不同的 RGB 组合下显示出独特的模式。
6.融入时间维度的年度 Embedding 应用
Embedding Field 在时间维度上的应用。通过生成年度嵌入,模型能够捕捉一年内的数据变化,包括不同作物的生长周期、植被的物候变化等。这种时间序列嵌入的应用使得研究人员能够追踪地表变化,并根据时间总结出独特的时空模式。
「年度 Embedding 的应用」
「作物生长分析」:通过比较不同年度的嵌入向量,可以识别出作物的种植/收获时间,帮助农业领域的决策。
「物候变化研究」:嵌入模型能够捕捉到植被的生长和变化趋势,提供了对长期气候影响下的生态系统动态的洞察。
作为一种自监督学习方法,**Embedding Field **的最大优势在于其高效的低维表示与多源数据融合能力。它有效地克服了传统预处理中的繁琐步骤,使得数据处理更快速、更智能,特别是结合了时间维度的动态分析,能够捕捉长期趋势。这对大规模土地利用变化、灾害监测等任务具有显著价值。
欢迎交流
笔者长期从事人工智能、遥感、大模型等业务
欢迎添加微信交流