第一篇SCI背后的故事——遥感影像模式识别研究

文摘   2023-01-26 15:06   安徽  


本文转载自《测绘地理信息》2013年第38卷第1期 文章。

作者简介:武汉大学测绘遥感信息工程国家重点实验室2010级博士生,主要研究方向是高光谱影像分析、高分辨率图像处理和模式识别。

测绘遥感信息工程国家重点实验室研究生自主设立的GeoScience café 论坛的“第一篇SCI背后的故事”系列文章选登。


回想我的第一篇 也总结了很多经验与教训 SCI 论文,当时作了很多努力 。希望我的这些科,研经历对大家有所帮助。
我是 2008 年开始进入武汉大学测绘遥感信息工程国家重点实验室学习的,当时我的研究方向是两位导师共同给我确定的:张量分析。2008 年夏天,陶老师来过一次武汉,我们匆匆见了一面,此后都是通过 E-mail讨论问题。当时他给了我 2篇论文,都是在2007 年最新发表的。当时这两篇文献我看了很久也没看懂。第一篇是“监督张量学习”。在模式识别领域,常规的机器学习方法都会以一个向量作为样本的特征输入,例如一张人脸图像会被重排列为一维向量处理,而在遥感影像处理中,每个像素对应着一个光谱特征向量,但是,在很多时候,我们要处理的对象并不是一维向量能够描述的,例如灰度图像本质上是二维矩阵,而彩色图像是三维的,视频影像则是四维的,那么,这种多维数组怎么用模式识别的方法进行处理?“监督张量学习”这篇论文就解决了这个问题。第二篇论文是陶老师发表在模式识别领域顶级期刊 IEEE TPAMI 的论文,提出了一种多特征的高阶张量构造方法。以上这些都是我后来对这两篇文章的理解。而当时我遇到的第一个问题就是公式看不懂。两篇论文一共出现了 70 多个公式,全部都是我从前没有见过的,于是,我求助于陶老师。陶老师当时在新加坡,工作特别忙,再加上联系也不方便,交流了好久我还是没有解决这个问题。这时我就明白了,只能靠自己钻研才能真正解决这个问题。
第一篇文章,作者将支持向量机在多维线性代数框架下扩展成为了支持张量机。那个时候,我连最基本的支持向量机都不知道,于是借了好几本书狂看。第二篇文章里面,作者提出一个模型。由于数学功底不够,在模型求解矩阵的微分那一部分我看不懂。后来我重点看了张贤达先生的矩阵书,终于把它弄懂。最后,当我把全部公式都推导清楚给陶老师汇报的时候,他却回信说:你的公式推的很对,但是这不就是我的方法吗?他不知道的是,我是花了快一年时间才把那两篇论文看懂。
我的第一篇 SCI 论文的设想是把这两篇文章的方法结合起来用于遥感影像处理,也就是把张量表达和支持张量有机结合起来做遥感影像目标识别。当时看起来实验效果很好,张老师要求我尽快完成论文。可是我写了一个夏天,并且写得非常痛苦。最后投到 IEEE TGRS 的时候,论文只有 20 页(单栏双倍行距),现在看来,这样短的篇幅投稿 TGRS 不用审稿都会直接被拒绝。果然,到了 2009 年 1 月就失败了。失败之后,我总结了一些原因。
第一个原因,没有把模式识别和遥感影像处理这两个研究领域的情况调查清楚。我做的是模式识别的应用,投的是遥感期刊,相关的工作有谁做过了?做出了什么成果?当时我没有做过调查。写这篇论文,我总共也就只看了那两篇外文文献,以至于参考文献我都不知道该列什么好,最后我只好把这两篇文献的参考文献作为我的参考文献。第二个原因是文章的创新性没有体现:用多维数组(张量)来描述目标和一维数组(向量)到底有什么优势?
当时我的文章用了三个示意图,可是这三个示意图都不能很好地回答这个问题,并且也没有详细的理论解释。由于对理论部分说明得不够,直接导致对比实验设置的也有很大问题。我的方法总共只有 2个对比实验,而且实验用的影像也很有限:我没有找到比较合适的实验数据。由于这篇文章的思路还是挺新的,所以两个审稿人给的意见都是大修,但副主编给的却是拒绝。显然,我很不服气,决定根据审稿人的意见修改后重新投一次。花了 2 个月修改这篇文章,主要是把实验重新做了一遍,2009 年 3月又投出去。这一次换了审稿人,可是受到的质疑更多。这次论文的篇幅到了 30 页,增加了很多细节,同时由于我的经验不足,也出现了很多没有说清楚的问题。这次,审稿人建议投稿到 GRSL,我接受了审稿人的建议。后面就比较顺利了,7 月份投稿到 GRSL,8 月份小修的意见回来,其实没什么意见,我第二天就上传了修改稿,然后就顺利接收了。我的第一篇 SCI 论文前后总共花了快两年时间,论文接收的那一刻我没有兴奋的成就感,只是觉得终于顺利结束了这个漫长的工作。
于是,在后来的几年里,我一直大量地看文章,慢慢地就知道了文章的级别和分类。最顶级的 Top类就是 Science、Nature,也包括 PNAS 等,这些期刊
与我的研究直接相关的文章可能一年都不到一篇,但是我还是会经常看。我重点看的期刊是第一类和第二类,基本按照中科院的文章分区来定的,第一类 包 括 SPM、IJCV 和 TPAMI;第 二 类 包 括 TIP、TSP、TNN、TSMCB、PR 等。它们都是模式识别的好期刊。遥感方面的几个期刊,包括 TGRS、IJPRS等。国内的期刊我也会看,主要是在新进入一个小领域的时候,直接看大量英文文献效率较低,这时先阅读一些国内文献是比较好的选择,一般选择看国内知名的学者写的综述或者全国优秀博士论文的相关文章。此外,计算机学科的顶级会议我也会跟进,因为会议审稿周期短,一篇文章从完成到发表只需要几个月,而比较顶级的 期 刊 如 TPAMI 可 能 需 要 2年,所以计算机学科大家都重视会议,例如 NIPS、CVPR、ICCV等。

经过一段时间的积累,我的长进不小。再跟陶老师讨论新的研究的时候,我已经可以很快的理解他的方法。这次,他给我介绍了刚发表在 TSMCB 的文章,我很快就感觉到这个篇文章可以借鉴到遥感影像多特征分类。遥感影像分类的任务就是把遥感影像的每一个像素属于哪种地物类别用计算机算法判断出来,分类结果可以直接用于制图或 GIS。他的方法引用了流形学习的思路。(流形学习是 2000 年在 Science 上提出的,接着出现到 TPAMI 上,后来出现到二类的期刊上面就已经到了 2008 年)。他的工作可以做多特征融合,但是,直接用在遥感影像处理,会遇到计算量的问题。因为他原来做的是影像检索,最多只有几千个样本,而我做影像分类会有几十万个像素。由于特征融合是非线性的,这里的问题时间复杂度和空间复杂度与样本数的三次方和二次方成正比。于是,我们提出了线性化该算法的解决方案,即可解决问题,又保证了分类精度。
这个工作的实验也非常顺利,我做了很多组实验,然后总结实验结果、写成论文。当时我已经看过很多的文献,因此这篇文章写的比较快。文章是2010 年圣诞节左右完成,2011 年 1 月投出的,在 2011年 7 月被接收,审稿花了半年时间。
这两个工作做完之后,我遇到了创新点的挖掘问题。这时候我已经读博士一年级了,必须要培养自己独立从事研究工作的能力。我的解决方案就是从大量文章里面挖掘信息。看文章的时候我会以审稿人的角度来审阅。对于常见的机器学习方法,我会尽量多的了解。文章看多了以后,就会发现遥感领域的算法都是由一些基本的算法组合或改进的。
一个文章被剖析过后,我很快就可以定位到它的核心部分。我会看他做什么内容的?他的方法我熟不熟悉?这个方法有没有创新?他这个方法解决了问题没有:从理论上讲,它是不是能解决这个问题?对应从实验分析上,验证了这个
问题没有?这个文章有没有什么不清楚的地方(或者漏洞)?所有这些地方都是我可以进一步深入讨论的潜在创新点。

在去年夏天,我做了一个张量特征提取的研究。在确定研究内容之前,我看了大量的文献,基本上知道了做张量的人都是什么思路、做到什么进度了,做遥感特征提取的都有哪些团队,他们用了什么方法、出现了什么问题。经过加强数学基础,我自己也可以推导一些很复杂的公式了。但是,我又遇到一个新的问题:算法的计算量特别大。虽然实验室的计算机配置 很好,但是还是无法满足我的计算需求。这时候张老师又鼓励我说,在上世纪我国的科研硬件条件很艰苦,但是很多科学家却用世界三流的科研条件做出了世界一流的研究成果,因为客观条件对他们来说从来都不是问题。在这个精神的鼓励下,我想到借用同学们的计算机做并行计算。当时是暑期,我就调用了回家的同学们的计算机进行计算。由于实验室的科研任务量很大,大家往往只回家一周时间,于是我专门为相关的计算机安排了“档期”。最后我很快完成了多组实验,这个文章投稿出去了以后,3 个月收到的评审意见,再次修改后顺利接收。
最近我还做了高光谱目标探测的研究工作。我看到很多最新的机器学习方法,设想如何针对高光谱目标探测问题设计一个比较好的机器学习方法。在这个问题里,最大的挑战就是极少量训练样本带来的过学习问题。怎么解决这个问题?这里我引入了迁移学习和稀疏学习。这个工作,由于可以使用的数据不多,因此实验略显单薄,我想投 GRSL。但是,两位导师都建议应该投稿 TGRS,他们认为挑战国际最好的期刊才能收到本领域最优秀的专家给出的意见。果然,我收到了来自 3 个审稿人的约 60 条意见。当时连意见都看得很费劲,因为意见太多,我不得不把它们翻译成中文并分类整理。两位导师又给我列出了详细的回答意见原则,包括感谢审稿人意见、一对一回复、尽量补充实验、添加理论支持等,甚至对论文的排版格式都有要求。这篇文章的回答意见写了约 60 页,因为审稿人的很多意见都不是关于文章本身的问题,而是与我讨论这个机器学习算法,所以我花了很多的篇幅去把这些问题解释清楚。最后,我终于按照审稿人的意见把这篇文章改好后完成了投稿。

总的来说,让我感触最深刻的是:① 一定要自己努力掌握核心技术。我们的研究过程中虽然有导师的悉心指导以及同行之间的充分讨论,但是,别人的
成果永远只能在自己的研究里起锦上添花的作用,我们一定要掌握一套自己的“金刚钻”。② 多看最新的学术论文,让自己保持与国际最新的研究同步。③ 坚持就是胜利,好论文是靠辛苦努力做出来的。

空间信息勇攀高峰
冰霜林里争先发,川流与天竞入海!
 最新文章