在当今信息技术飞速发展的时代,海量的数据正在改变着我们理解世界的方式。无论是在学术科研还是产业创新中,如何从海量的文献和数据中提取有价值的知识,已成为各领域共同关注的话题。闽江学院的张红月博士深耕于知识图谱与文献计量分析的前沿,带来了她关于海洋遥感的最新研究报告,为我们揭开了数据背后的奥秘。今天,我们很荣幸邀请到张博士与大家分享她的研究成果,解读如何运用文献计量的知识图谱方法,在复杂的知识网络中理清发展脉络,发现研究前沿。报告分两篇,分别是国际和国内篇章。
引言
遥感技术的广泛应用是当下海洋科学取得重大进展的关键因素之一。海洋遥感有效弥补了传统海洋观测手段的不足,通过多种遥感器对海洋进行连续观测,极大地推动了人类对海洋的深入认知。它在海洋灾害防灾减灾、资源开发、海洋权益维护、生态保护以及环境保护等多个领域发挥了不可替代的重要作用。
科技文献是科研成果的结晶,凝聚了经典理论与前沿研究成果,作为一个庞大的文本数据集,其蕴含的知识价值巨大。知识图谱作为一种以文献为基础的计量分析模型,运用数学与统计学方法,对文献的分布结构、数量关系、变化趋势进行研究,并结合自然语言处理技术,深度挖掘特定领域的潜在知识与发展规律,为科研工作提供重要参考。
本文通过对1998年至2022年期间发表在WOS核心合集的13485篇海洋遥感主题的SCI-E文献,以及1990年至2022年中国知网上发表的596篇相关科技文献进行对比分析,探讨了该领域的研究发展态势与趋势演变。
全球海洋遥感知识图谱
全球海洋遥感研究热点关键词
作者关键词代表了科学出版物中提炼出的研究主题,反映了作者对研究主题的提取和表达。它们最真实地反映了作者的研究主题和意图。因此,研究热点的分析通常从对作者关键词的统计分析开始。图 1显示了基于关键词词频的前100个关键词的词云图。
图 1 作者关键词的词云图(关键词已进行预处理;词云中每个词的大小与其频率的平方根成正比)。
在处理了作者关键词(包括同义词合并)后,共获得了25314个关键词。图 2展示了频率超过60次的主流数据源关键词。从图中可以看出,“合成孔径雷达(SAR)”的出现频率最高,共出现1,225次。SAR是海洋遥感领域最常用的数据类型。在SAR之后,“中分辨率成像光谱仪(MODIS)”和“哨兵(Sentinel)”的出现频率分别为551次和412次。
数据源关键词包括多种遥感设备,如微波辐射计、雷达极化测量、激光探测与测距(LiDAR)、散射计和全球导航卫星系统(GNSS),反映了这些数据源在研究中的广泛应用。数据源关键词还涉及“土壤湿度与海洋盐度卫星(SMOS)”和“海洋广域视场传感器(SeaWIFS)”,用于获取海洋表面颜色信息,为海洋生态系统和水质监测提供数据支持。
具体应用领域还包括“土壤湿度主动被动卫星(SMAP)”,用于监测极地冰盖、冰川和海冰的变化;“全球导航卫星系统气旋观测卫星(CYGNSS)”用于监测热带气旋;以及用于地形测量的测高仪。
图 2 海洋遥感研究中主流数据源关键词的词频统计
图 3显示了频率超过100次的研究对象/目标关键词。从频率统计中可以明显看出,海面探测、海冰和测高是海洋遥感的主要研究主题。在海面探测方面,海表温度的研究占据优先地位,其次是海洋颜色和叶绿素的研究。船舶探测和目标提取也是研究热点。北极地区在海洋遥感研究中受到了最多的关注,这可能与全球变化导致的冰川融化有关。此外,与风速、测深、表面波、浮游植物和水质相关的关键词频率也超过了100次。
此外,辐射校准、大气校正和散射相关的关键词也超过了100次。总体来看,海洋遥感研究涵盖了广泛的应用领域,包括海面特性(温度、盐度等)、海冰(变化、厚度、分布等)、海洋生物与生态(海洋颜色、叶绿素、浮游植物等)、气象与气候(风速、气候变化、冰川融化),以及地形测量和海洋地质(测高、深度测量)等。
图 3 海洋遥感研究中主流应用类关键词的词频统计
基于作者关键词的共现关系,构建了海洋遥感研究中的热点主题集群网络,如图 4所示。主题集群的共现网络图展示了海洋遥感领域中关键词之间的关联程度。网络中的节点代表关键词,节点之间的边表示这些关键词在文献中共同出现的次数。节点的大小表示关键词的出现频率。
图 4 海洋遥感中关键词主题集群的共现网络图
作者关键词的主题集群明显分为两个热点集群:红色集群和蓝色集群。红色的节点和链接代表一个主题集群,如与“海洋颜色”相关的术语,包括“叶绿素”和“浮游植物”,表明该集群主要关注海洋生物和水质监测研究。蓝色的节点和链接形成另一个集群,与“合成孔径雷达”技术及其应用领域相关,如“特征提取”和“船舶检测”,突出SAR(合成孔径雷达)在海洋监测中的重要性。显而易见,“合成孔径雷达”是最大的中心节点,表明其在海洋遥感研究中的核心作用,并与许多其他关键词存在强关联。与其直接相连的关键词如“测高”、“散射”和“海上船只”显示了SAR技术在海平面测量、散射机制研究和海上船只探测中的应用。
基于作者关键词的主题集群共现网络展示了海洋遥感研究中的两个主要主题集群:以MODIS为代表的海洋观测和基于SAR的海洋监测。表 1展示了这两个主题集群中的热点关键词及其在主题集群网络中的中介中心性指数。
MODIS集群中的研究目标主要集中于海洋和陆地表面的观测,包括海表温度、海洋颜色、叶绿素浓度、校准、土壤湿度、验证、大气校正、测深、气候变化、浮游植物、辐射测量、水质、海平面等。中介中心性中“验证”具有最高的中介中心性(41.7),表明其作为研究目标的重要核心角色,以及在MODIS数据应用中连接各个研究主题的重要桥梁。“校准”和“海洋颜色”也是核心主题,其中介中心性分别为27.3和21.0。
SAR集群的研究目标主要集中在海洋表面的物理特征及动态,包括海表、海冰、测高、海洋测量、船舶检测、特征提取、海洋船只、北极地区、海洋温度、风速、目标检测、分类、海表波动、杂波和风。在此集群内,“海表”具有最高的中介中心性(67.8),表明其在SAR应用中的主要研究目标角色。此外,“海洋测量”、“测高”和“海冰”也是重要的研究主题,其中介中心性分别为45.0、37.9和25.1。
在MODIS主题集群中,“MODIS”和“哨兵(SENTINEL)”具有相对较高的中介中心性,表明它们在海洋遥感研究网络中的中心位置。相比之下,在SAR集群中,“雷达”具有最高的中介中心性。然而,与MODIS主题集群中的中介中心性相比,SAR相关数据源的中介中心性相对较低,这表明SAR相关数据源的细分程度更高,主题关键词的分布相对分散。
研究目标关键词的中介中心性为我们提供了哪些主题在各自领域内被广泛引用和研究的见解。它们可能作为这些领域研究网络中的关键节点。例如,在MODIS集群中,“验证”、“校准”和“海洋颜色”是处理和分析海洋遥感数据的核心步骤。在SAR集群中,“海表”、“海洋测量”和“测高”是研究海洋物理特征的关键主题。这些研究目标关键词的中介中心性水平差异,提供了关于海洋遥感领域研究重点和关键词之间关系的视角。
全球海洋遥感研究热点关键词演化
图5显示了国际海洋遥感科学文献在四个时间段(1998-2002年、2003-2009年、2010-2017年、2018-2022年)以及整个1998年至2022年期间的热点关键词词云。在词云中,每个关键词的大小与其在科学文献中出现的频率成正比。从中可以观察到海洋遥感研究领域在不同时间段的研究重点及演变。
图 5 不同时间段海洋遥感科学文献中的热点关键词词云图(中间的词云图代表1998年至2022年的热点关键词)。
表 2 海洋遥感研究四个阶段的前10个主流关键词及其词频
关键词 | 1998-2002(词频) | 2003-2009(词频) | 2010-2017(词频) | 2018-2022(词频) |
---|---|---|---|---|
1 | synthetic aperture radar(30) | modis(70) | synthetic aperture radar (313) | synthetic aperture radar (779) |
2 | sea ice(29) | microwave radiometry(68) | modis(204) | sea surface (363) |
3 | microwave radiometry(26) | synthetic aperture radar(68) | smos(175) | Sentinel (348) |
4 | scatterometer(18) | sea ice(63) | altimetry(154) | sea measurements (277) |
5 | radar(14) | ocean color(61) | sea ice(150) | Modis (255) |
6 | sea surface(14) | altimetry(60) | sea surface temperature(138) | deep learning(253) |
7 | altimetry(10) | sea surface temperature(48) | soil moisture(121) | sea surface temperature(236) |
8 | calibration(9) | calibration(44) | ocean color(120) | sea ice(228) |
9 | geoid(9) | chlorophyll(43) | chlorophyll(107) | feature extraction(217) |
10 | interferometry(9) | seawifs(42) | validation(94) | marine vehicles(215) |
表 2显示了四个阶段的前10个关键词及其出现次数。其中:
1998-2002年期间(左上角),"微波辐射计"、"极化测量"、"测高"、"合成孔径雷达"、"辐射传输"、"校准"、"云"和"海面电磁散射"等关键词非常突出。"合成孔径雷达"、"海冰"、"微波辐射计"和"散射计"尤为显眼,表明在该时期合成孔径雷达和微波探测技术的重要性。这反映了最初对海洋和大气参数的遥感测量,强调了微波辐射计和合成孔径雷达在研究海洋表面特征中的应用。
结合热点关键词列表可以看出,2003-2009年期间(左下角)"MODIS"、"微波辐射计"和"SAR"频繁出现,研究重点包括海洋颜色、测高、海表温度和叶绿素监测。"MODIS"、"GPS"、"测深"、"卫星遥感"和"干涉测量"等新关键词开始出现。这一时期标志着遥感技术在海洋应用中的成熟,MODIS和GPS技术得到广泛使用,同时对测深和卫星遥感的兴趣也在增加。
在热点关键词列表中, 2010-2017年期间(右下角)"合成孔径雷达"、"MODIS"和"SMOS"是主流数据源,研究重点包括海冰、海表温度、土壤湿度、海洋颜色和叶绿素。此外,"深度学习"和"船舶检测"等关键词出现,反映了该时期机器学习和深度学习技术在处理海洋遥感观测数据中的应用。
2018-2022年期间(右上角), "SAR"、"哨兵"和"MODIS"是这一时期的主流数据源,研究重点为海表、海洋测量和海冰探测。"深度学习"、"特征提取"和"海洋船只"等关键词尤为显著,表明对海表温度和海洋表面特征的研究持续受到关注,同时深度学习算法和特征提取成为热点主题。
在1998-2022年整个时期内,海表、海冰、测高和海表温度是研究热点。主流数据源包括SAR、MODIS、哨兵和SMOS,合成孔径雷达技术和微波遥感技术在海洋遥感研究中占据核心地位。
图 6 海洋遥感研究中四个阶段数据源关键词的词频统计
图 6显示了四个阶段中数据源关键词的词频统计。SAR在所有时期都是使用最频繁的数据源,其次是MODIS。微波辐射计的使用显示出稳定且上升的趋势,在每个阶段都有广泛的应用。LIDAR的使用稳步增加,在2010-2017年期间达到了48次,2018-2022年期间达到了86次。
GPS和GNSS被广泛用于海洋遥感定位和测高,自2003年后使用量稳步增长,尽管在1998-2002年期间使用较少。2002年发射的GRACE卫星被广泛用于海洋测高,其使用量随时间逐步增加。2009年发射的SMOS卫星在2010-2017年期间的使用达到了157次的峰值,但在2018-2022年期间略有下降。2014年后发射的哨兵卫星在海洋遥感中的使用显著增加,哨兵1号和哨兵2号数据在2018-2022年期间的使用分别达到了102次。
SeaWiFS(海洋广域视场传感器),1997年首次随“OrbView-2”航天器发射,主要用于监测海洋颜色、浮游植物及海洋生态环境的变化。其使用量在2003-2009年和2010-2017年期间较高,但在2018年后显著减少。2015年发射的SMAP(土壤湿度主动被动)卫星广泛应用于海洋遥感研究,2018-2022年期间使用频率达到了68次。MERIS(中分辨率成像光谱仪)是欧洲航天局(ESA)的载荷,用于中分辨率成像光谱观测。它于2002年随ESA的Envisat卫星发射,MERIS数据在2010-2017年期间使用达到52次的峰值,但在2018-2022年期间有所下降。
总的来说,不同的数据源、技术设备、卫星数据和传感器在海洋遥感研究中表现出不同的特点。它们的使用频率和趋势反映了不同数据源在不同阶段的重要性和应用水平。
图 7 海洋遥感研究中四个阶段主流应用关键词的词频统计
图 7显示了四个阶段中应用关键词的词频统计。"海表"和"海冰"关键词在所有时间段内呈现显著的增长趋势,尤其是在2010-2017年和2018-2022年期间,表明对海洋表面和海冰监测与研究的关注不断增加。"测高"在各个时期都保持着较高的频率,突显了海洋测高技术在海洋遥感中的重要性。"海洋颜色"和"叶绿素"关键词也有较高的频率,反映了对海洋生态和水质的关注。"浮游植物"的高频率表明对海洋生物群落和生态系统研究的重视正在增加。"海表温度"的词频逐渐增加,表明对海洋温度变化的持续关注。
"风速"和"表面波"关键词在所有时间段中始终保持较高频率,表明海洋气象与动力学研究和监测的重要性。气候变化关键词的频率增加,反映了对海洋在全球气候变化中的角色和影响的关注。特别值得注意的是,"特征提取"、"海洋船只"、"目标检测"和"船舶检测"的词频在2018-2022年期间迅速增加,表明近年来海洋遥感研究逐渐转向目标检测和特征提取,特别是与海洋船只相关的研究。2010年后,"溢油"研究也受到了关注,2018-2022年期间"溢油"关键词的出现次数达到了40次。
图 8 海洋遥感研究中四个阶段主流方法类关键词的词频统计
图 8显示了海洋遥感研究中四个阶段方法类关键词的词频统计。传统方法如“分类”和“监测”的出现频率保持稳定并逐渐增加。“数据同化”也持续受到关注,使用频率逐渐上升。特别值得注意的是,“深度学习”、“机器学习”、“图像分割”和“数据模型”的使用频率在2018-2022年期间迅速增加。这一趋势表明,深度学习、数据模型和语义分割在该时期已成为海洋遥感研究中的热点主题。
全球海洋遥感研究主题集群演化
图 9展示了海洋遥感领域中四个阶段主流作者关键词的共现矩阵,使用Walktrap作为聚类算法。从中可以观察到海洋遥感领域作者关键词的主题集群随时间的演变。基于作者关键词的海洋遥感主题集群演变桑基图如图 10所示。
图 9 国际海洋遥感中四个阶段的作者关键词主题集群共现网络图
图 10 基于作者关键词的全球海洋遥感研究主题集群演变桑基图
从四个时期的关键词共现图(图 16)中可以观察到,1998-2002年期间主题集群相对分散,共有11个集群。最大的集群是“合成孔径雷达”,共出现220次,其次是“微波辐射计”,共出现31次。其他九个集群分别是“测高”(27次)、“校准”(27次)、“辐射传输”(17次)、“海面电磁散射”(12次)、“粗糙表面散射”(9次)、“云”(8次)、“海洋表面”(4次)、“微波遥感”(4次)和“极化测量”(4次)。
在2003-2009年期间,共有8个主题集群。排名第一的是“微波辐射计”,总频率为743次,其次是“MODIS”(459次)和“测高”(103次),频率都超过了100次。其他五个集群分别是“合成孔径雷达”(85次)、“卫星遥感”(56次)、“GPS”(31次)、“干涉测量”(29次)和“测深”(27次)。
2010-2017年期间,主题集群数量进一步减少至五个,分别为“MODIS”(1374次)、“SMOS”(1469次)、“合成孔径雷达”(443次)、“测高”(301次)和“散射计”(28次)。
在2018-2022年期间,主题集群进一步集中为三个主要集群:“合成孔径雷达”、“哨兵”和“海表”,频率分别为3529次、2322次和3995次。
在整个四个时期中,SAR始终是一个焦点主题和热门集群。“测高”在前三个时期是独立的主题集群,频率逐渐增加,并在2018-2022年被并入“海表”集群。“微波辐射计”在前两个时期是独立集群,2010-2017年并入“SMOS”集群,2018-2022年并入“海表”集群。“MODIS”在2003-2009年和2010-2017年是独立集群,随后在第四个时期并入“哨兵”集群。“SMOS”从2003-2009年期间的“微波辐射计”集群的一部分演变为2010-2017年的独立集群,之后在2018-2022年并入“海表”集群。
总体来看,主题集群的发展显示出聚集的趋势,集群数量减少,但每个集群中的关键词数量和关键词共现频率增加,表明关键词之间的关联性更强。
全球海洋遥感研究热点主题趋势预测
利用主题图(参见图 11)展示1998年至2022年海洋遥感科学文献中不同主题的发展水平及其相互关系的重要性。通过将不同主题按照其发展程度(Density)和相关程度(Centrality)进行划分,展示了海洋遥感研究中的热点和趋势。
图中的四个象限代表不同类型的主题。其中,第一象限(右上角)中的主题发展水平高,并且与其他主题有紧密的关联,是成熟且重要的核心主题。第二象限(左上角)中的主题发展水平高,但与其他主题的关联性较弱,属于高度发达但孤立的主题。第三象限(左下角)中的主题发展水平低且关联性较弱,属于边缘性或新兴主题,尚未成为研究的重点。第四象限(右下角)中的主题发展水平低,但与其他主题有较强的关联性,可能是未来有潜力发展的主题。
图 11 1998-2022年海洋遥感的主题发展战略四象限图
第一象限代表核心主题(Motor Themes),其特点是高发展水平和高度相关性。在海洋遥感科学文献中,使用合成孔径雷达(SAR)和深度学习算法进行船舶检测和识别已成为一个有前景的研究主题,具有显著的发展前景,代表了海洋遥感领域的主流研究方向。
第二象限代表利基主题(Niche Themes),其特点是高发展水平但低相关性。海洋遥感研究中的一个突出主题是“海表”主题,尽管其发展水平很高,但与其他主题的相关性相对较低。该主题集群涉及海表特性、海洋温度、海冰、北极地区和微波辐射测量等方面。
第三象限代表新兴或衰退主题(Emerging or Declining Themes),其特点是低相关性和低发展水平,表明这些主题可能是新兴或正在衰退的主题。在海洋遥感科学文献中,卫星测高主题属于这一象限。该主题集群包括GPS、GNSS、GRACE和海平面等关键词。
第四象限代表基础主题(Basic Themes),其特点是高度相关性但低发展水平,代表了基础但相对静态的主题。海洋遥感中的一个典型例子是使用MODIS、哨兵(Sentinel)和Landsat数据综合监测海表温度、海洋颜色和叶绿素,以及使用LiDAR进行测深等基础主题。该象限中的主题相对稳定,是该领域的基础。
图 12展示了全球海洋遥感研究中的趋势主题及其随时间的变化情况,横轴代表年份,纵轴展示了不同的研究主题,圆圈的大小反映了该主题在不同时间段内的词频(圆圈越大,词频越高),表明该主题的研究热度。
图 12 全球海洋遥感研究的研究主题趋势预测
从中可以看出,海面测量(Sea Measurements)、海表面(Sea Surface)、合成孔径雷达(Synthetic Aperture Radar)、海表温度(Sea Surface Temperature)等主题在最近几年(2018年后)显示出较高的词频,反映了这些主题在全球海洋遥感研究中的重要性和持续关注。尤其是合成孔径雷达和海表温度,由于其在海洋监测和海洋气候变化研究中的广泛应用,成为近年来的研究热点。
其他如MODIS、SMOS、Landsat和海洋水色(Ocean Color)等遥感数据源也在不同时期内持续受到研究者的关注,显示出这些数据源在海洋遥感领域中的重要性。值得注意的是,算法(Algorithms)和微波(Microwave)等技术主题在2000年至2010年期间表现出较高的研究热度,显示了这些技术在海洋遥感研究中的基础作用。然而,随着技术的逐渐成熟,相关研究的热度有所下降。
总的来说,该图表明了全球海洋遥感研究的主题集中度逐步增加,特别是在海洋表面测量、温度监测和合成孔径雷达等方面。此外,研究者对新兴数据源和先进算法的关注也持续推动了该领域的发展。未来的研究可能将更多聚焦于高频率的遥感数据应用及其在海洋环境监测中的创新应用。