这是 科研写作研究所 的第 3405 篇原创文章
文献检索是学术研究和论文写作过程中的一项基础且关键的活动,掌握有效的文献检索技能对于写作者来说是非常重要的。然而,很多作者在文献检索时,常常反馈“文献比较少”“不知道如何找到更多相关文献”……因文献问题导致论文写作进程拖延的情况时有发生。那么,如何检索到更多与论文相关的文献呢?结合C刊论文,我们总结了五种常用的文献检索方法,供写作者参考。
一、滚雪球方法
如果作者的研究主题属于新兴领域、交叉学科领域或小众领域,即直接以研究主题词检索,得到的文献数量较少的情况下,可考虑使用滚雪球的文献检索方式。滚雪球检索的关键在于找到论文相关的核心文献,并以这些核心文献为中心,向前或向后滚动检索核心文献的施引文献或参考文献,从而组成论文的基础文献。
比如《基于定量分析的创新生态系统文献评述与整合框架》这篇论文,作者研究的是“创新生态系统的定量分析”,利用滚雪球方式采集文献数据的基本步骤如下:
1.确定检索数据库。设定Web of Science核心合集数据库作为文献来源数据库。
2.确定检索关键词。主题词设定为“Innovation Ecosystem”,即论文的研究主题“创新生态系统”;限定为学术研究文献后,共计检索到6000多篇文献。
3.筛选期刊。核心文献检索需要严格控制研究质量,因此作者将文献来源限定为2021年英国商学院协会(ABS)四星及其以上的管理类国际期刊,筛选得到116篇文献。
4.全文浏览和内容筛选。浏览116篇文献的标题、关键词、摘要等,保留其中使用定量研究方法的权威文献36篇。这36篇即为论文的核心文献。
5.加入向后引用的文献。从上述36篇核心文献的参考文献中,选取与论文相关的文献。为了控制研究质量,同样可以执行第四步的操作,即限定这些参考文献的期刊。
6.加入向前引用的文献。从上述36篇核心文献的施引文献中,选取与论文相关的文献。为了控制研究质量,同样可以执行第四步的操作。
7.合并文献,将第五步和第六步筛选得到的文献合并,即为论文的基础文献。
二、布尔运算法
布尔运算是文献检索中常用的一种方法,通过使用逻辑运算符(AND&OR&NOT)来组合检索关键词,以获得足够的与论文相关的文献。
如果需要同时包含多个概念时,使用AND或OR运算符。比如《多学科视角下的城市环境心理健康影响研究进展——基于CiteSpace的可视化分析》这篇论文,作者研究的是城市环境对心理健康的影响。在检索文献时,需要选择同时包括“城市环境”AND“心理健康”及相关关键词,通过不同组合方式确定检索关键词或词组。作者选择的检索组合方式为:SU=城市环境*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度);居住区*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度);社区*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度);建成环境*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度);邻里空间*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度);街道*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度);城市景观*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度);建筑*(心理健康+情绪+压力+幸福感+精神健康+身心健康+愉悦度)。
如果需要排除某些概念或避免特定主题时,使用NOT运算符。如《打铁还需自身硬:职场人士就业能力的影响因素及其理论解释》这篇论文,作者研究的是职场人士就业能力的影响因素。在检索文献时,作者选择以“就业能力”“可就业能力”“可就业性”“就业力”“可雇佣性”“可雇佣能力”作为检索词,由于作者研究的是职场人士,因此在检索时同时排除(NOT)“学生”“大学生”“毕业生”“失业者”等关键词。
三、概念溯源法
有时候作者检索不到足够的文献,是因为不清楚该如何灵活选择可供检索的关键词。这种情况下,追溯论文研究主题的概念史,可能帮助作者解决如何选择检索关键词的问题。
比如《新世纪以来国际城市群研究前沿及其四维度热点解读——基于Citespace对Web of Science 数据库的文献计量》这篇论文,研究主题是“城市群”。关于这一概念,学术界没有统一的定义。因此作者先梳理了国内和国外学者研究“城市群”时使用的概念,如法国地理学家戈特曼使用“megalopolis”这一概念、美国区域规划协会将其定义为“megaregion”、后来学者们又称其为“全球巨型区域(global city-region)”、国内学者提出“都市连绵区(metropolitan interlocking region)”“城市群(urban agglomeration)”等,基于这些城市群概念和英文名称的梳理,作者找到了合适的检索字段。
再如《国际二语在线合作写作研究进展与前沿展望(2010-2023)——基于Citespace的知识图谱分析》这篇论文,研究主题是“二语在线合作”。在检索文献时,作者先对其概念进行了拆分“合作写作是指两个及以上学习者在整个写作过程中通过交流共同创作某个文本的写作教学活动,而在线合作写作是指两个及以上写作者通过维基(wiki)、谷歌文档(Google Docs)等在线协作平台共同完成一篇文章的写作教学活动”,因此作者选择了“ collaborative writing / cooperative writing / team writing / group writing / joint writing”并列“ online / computermediated / web / wiki / E-writing / Google Docs / shared document ”作为检索关键词。
四、近义词检索法
不同的作者在撰写文献时可能会使用不同的术语来表达同一概念或事物,因此我们在文献检索时需要考虑到这一因素,多尝试变换论文主题词的形式,比如使用主题词的同义或近义词进行检索,从而减少因遗漏关键词而错过的相关文献。
比如《新中国成立以来儿童青少年“体育健身”的话语建构研究》这篇论文,作者研究的是儿童青少年体育健身。在检索文献时,作者将“体育健身”“健身”作为体育健身的检索关键词,将“儿童青少年”“青少年儿童”“中小学生”“儿童”“小学生”“青少年”“中学生”“初中生”“高中生”作为儿童青少年的检索关键词,之后再使用布尔操作符(AND与OR)将上述检索词互相连接,进行检索。
如果不清楚主题词的同义或近义词包括哪些,可以借鉴已有研究的观点。如《国内二语语法能力研究(1981-2021)》这篇论文研究的是“语法能力”,在检索文献前,作者先引用文献说明“鉴于语法能力同语法意识、语法发展和语法习得密切相关(Loewen,2020;龚彦知等,2021)”,所以论文选择了语法能力、语法意识、语法发展和语法习得作为检索主题词进行文献检索。
在确定主题词的同义或近义词时,除了借鉴已有研究的直接观点,还可以依据学术研究的现状综合判断。如《人工智能的经济效应:现状、热点及展望——基于 CiteSpace 的文献综述》这篇论文研究人工智能的经济效应,在检索文献时,作者不但以“经济”作为检索关键词,还考虑到“经济发展涉及面较广,学界比较关注人工智能对劳动力就业、收入不平等、经济增长与生产率等方面的影响”,所以检索表达式如下:主题=(“artificial intelligent”OR AI)AND(labor NEAR/3*employ*OR job*OR“economic productivity”OR“social productivity”OR income OR economy*NEAR/3 grow*OR economy*NEAR/3 develop*)。
五、模糊匹配检索
模糊匹配检索是一种在不确定关键词确切形式时使用的检索策略。一些数据库提供模糊逻辑搜索选项,允许搜索近似匹配的词。除此之外,还可以利用数据库的高级搜索选项,将主题、篇名、关键词、研究领域等相结合,进行更复杂的搜索策略。
主题+篇文摘的组合检索方式。如《科学数据价值:研究述评与展望》这篇论文研究的是“科学数据价值”,如果直接以“科学数据价值”作为检索词,那么检索到的文献比较少。因此,作者采用了主题+篇文摘的组合检索方式,以“scientific data”OR“research data”作为标题检索词,且以“value”为摘要检索词进行检索。
主题+研究领域的组合检索方式。如《“家”的地理学:研究概况、最新进展及启示——基于CiteSpace和Bibliometric的图谱量化分析》这篇论文研究的是“‘家’的地理学”,因此作者在检索文献时,将主题词设定为“home”,研究领域限定为“Geography”。
主题+关键词的组合检索方式。如《基于BERTopic模型的数字政府治理领域的主题识别与内容分析》这篇论文研究的是“数字政府治理”,作者设定“主题=数字政府治理OR篇关摘或关键词=数字政府治理”并限定年份“2011-2023”作为检索式。
点击下方卡片