《RSEI应使用主成分分析或核主成分分析?》一文近日在《武汉大学学报(信息科学版)》2023年第4期正式发表。该文网络版自去年7月首发以来,已被下载了近1500次,受到读者的欢迎。论文除了谈及遥感生态指数RSEI与nRSEI的区别外,还讨论了若干遥感科学研究的基础问题,主要有:
遥感研究中有大量的分析涉及到因子或变量之间的相关性,而相关性强弱究竟如何界定是一个经常困扰研究者的问题。本文引入了3种相关性强度的划分方案(下表)。可以看出,三种方案虽然略有差异,但都将r >|±0.7|作为强相关,而至少是r<|±0.5|才认定为弱相关。
强相关(左)与中等相关(右)
RSEI与其4个分指标之间的相关性是不是越高越好?回答是否定的。RSEI与各个分指标间的相关性要视具体情况而定,例如在植被不多的地区,RSEI与植被的相关系数大于0.9就不正常,反之亦然。遥感模型经常由多个变量合成,尺度差距很大的变量能否放在一起建模?粗分辨率的社会经济统计数据能否与RSEI的30 m分辨率指标放在一起建模?这样做会对模型的精度产生什么影响?这是遥感建模必须要考虑的问题。下图给出了30 m分辨率指标和1000 m分辨率指标集成建模的结果,答案一目了然。(a) 30 m分辨率指标合成的RSEI影像; (b) 加入1000 m分辨率指标后合成的影像早期的精度验证采用的是严格的地面实地验证。1999年以来,随着IKONOS等许多高分卫星的相继升空,地面大部分实际情况可以在米级至分米级的高分影像上得以辨析,因此地面精度验证也可以借助高分辨率影像来实现,但是其前提是作为标准参考影像的分辨率必须比待验证影像高。采用第三方的数据来代表地表真实性进行精度验证通常是不可接受的,因为第三方数据本身就存在精度问题,采用其进行精度验证会导致误差叠加和放大。样本量是保证遥感验证精度的重要前提,太小的样本量不具验证价值,只有足够的样本量才能保证样本指标具有充分的代表性。不同的教科书对最低样本量的要求不尽相同,但每类需要60个左右的样本是基本要求。以上简要叙述了几个与RSEI有关的遥感基础问题,更多的可以参看原文。
在RSEI建模上除了上面分析的问题外,还有随意将多个主分量相加、更改正规化变换、添加多个强相关变量等问题,这些都涉及到遥感的基础知识问题。因此,今后还将就遥感建模的共线性、模型的普适性、主成分分析原理及其地学应用等教科书上比较少涉及的问题进一步讨论。
原文:徐涵秋, 李春强, 林梦婧. RSEI应使用主成分分析或核主成分分析?. 武汉大学学报(信息科学版), 2023, 48(4): 506-513. DOI:10.13203/j.whugis20220319.原文链接:http://ch.whu.edu.cn/cn/article/doi/10.13203/j.whugis20220319
校对:任萌杰
编辑:李春强