测量创新的扩散:基于引用分析

文摘   2024-11-15 21:26   江苏  

『柏拉图说』是由南京大学计算传播学实验中心的成员们于2022年4月发起的论文精读与推介活动,我们将定期推送新闻传播学TOP期刊最新内容、新闻传播学前沿及相关量化研究方法论文。我们致力于深耕传播学领域,紧跟专业研究热点,延伸学术视角,拓展群体智慧。

柏拉图说 论文推介第 164 

Zhai, Y., Ding, Y., & Wang, F. (2018). Measuring the diffusion of an innovation: A citation analysis. Journal of the Association for Information Science and Technology, 69(3), 368-379.

摘要

创新改变了我们的研究传统,成为推动个人、团体和社会创造力的驱动力。与此同时,跨学科研究越来越被视为应对我们社会所面临复杂挑战的一种途径。在本文中,我们将潜在狄利克雷分配LDA(作为研究实例)的引用作为创新扩散的一个代理情境。通过对主题演变的分析,我们将扩散过程分为五个阶段:测试与评估、实施、改进、扩展和衰退。通过对主题和学科的相关性分析,我们展示了 LDA 在不同学科中的应用。我们还基于对跨学科研究的分析揭示了不同学科之间的跨界扩散。结果表明,随着 LDA 转移到不同领域,每个学科的采用情况与那些具有相似研究兴趣的学科相对接近。我们的研究结果进一步支持了研究人员对创新影响形成的理解。

一、引言

  1. 创新与扩散

  • 创新被视为推动经济增长和社会创造力的关键因素,在学术和实践领域都备受重视。

  • 扩散是创新在社会系统中随时间通过特定渠道传播的过程,对于科学研究而言,其重要性在于体现创新价值,促进新思想发展,确保研究成果的有效性和影响力。

  • 本研究的创新点

    • 研究基于大规模引用数据,以 LDA 为例,运用主题建模技术,分析其引用历史,揭示创新的扩散过程,包括阶段划分、跨学科扩散及在不同学科的应用,为创新扩散研究提供新视角。



    研究方法

    1. 数据集选择

    • 选择 LDA 作为研究对象,因其引用量大且应用广泛。数据来源为 Scopus 数据库中 2003 - 2015 年引用 LDA 的文章,包含多种文献类型,数据包括标题、摘要、年份、作者等。学科分类采用 Scopus 的 ASJC 分类法。

    • 为了揭示LDA的扩散过程,首先检查LDA在整个引用历史中的主题演变,以回答以下问题——哪些研究主题最受关注以及在采用LDA的过程中提出了哪些主题。第二步构建学科-主题矩阵,然后提取与每个学科最相关的主题。

  • 研究方法步骤

    • 对 LDA 引用的标题和摘要进行预处理,包括小写转换、去停用词等操作。

    • 采用 LDA 主题发现模型进行主题建模,确定主题数量为 30 个——由与每个主题关联度最高的前 5 个单词标记,使用 Gensim 库并应用标准参数。

    • 通过每篇文章的主题比例相加得到流行主题(流行主题即在多篇文章中占比较高的主题),例如下表。又使用每年的主题流行度来确定每年排名前五的热门主题。

    • 通过操纵论文 - 学科矩阵和主题 - 论文矩阵获取学科 - 主题矩阵,确定每个学科的关键主题。




    研究结果


    基于LDA的主题演化,遵循Rogers的扩散模型(1962),我们进一步将创新的扩散过程分为五个阶段:测试和评估、实施、改进、扩展和衰落。接着文章将这五个阶段并与2003——2015的扩散阶段一一对应,用文字加图像的方式解释了LDA的发展历程。

    1. 创新扩散阶段划分

    • 测试与评估阶段(2003 - 2006 年):主要涉及技术和应用相关主题,研究者评估创新性能和算法,对应 Rogers 扩散模型的知识和说服阶段,有助于创新扩散和跨学科理解。

    • 实施阶段(早期):创新在原领域被广泛接受并应用于解决其他问题,如 LDA 升级用于图像注释任务,相关主题在 2004 - 2006 年快速增长。

    • 扩展阶段(整个过程):创新应用跨越学科边界,数据相关主题增多,创新得到认可,重点转向解决不同领域实际问题,形式和任务类型不变。

    • 衰退阶段(2009 - 2011 年):部分主题因新技术(如神经网络)替代而衰退,但创新扩散过程不会结束,新老创新会不断更替。

    • 改进阶段(贯穿始终):涉及算法增强和缺陷弥补,如确定主题数量、更新参数等,如推理、贝叶斯等主题一直是 LDA 研究重点。

    • 根据 LDA 主题演变,将创新扩散过程分为五个阶段:

  • 学科主题分析

    • 物理科学领域:涵盖技术、数据和应用相关主题,不同学科关注不同,如计算机科学和数学与推理相关主题连接,地球和行星科学等关注图像注释,能源学科虽引用 LDA 论文少,但在安全报告主题提取中有应用。

    • 健康科学领域:医学信息学发展迅速,医学、护理等学科有自然语言处理、医疗疾病、人类基因等相关主题,部分直接应用 LDA 于文本数据,部分扩展其用于医学研究和知识发现。

    • 生命科学领域:主要关注人类基因组主题,神经科学聚焦机器学习相关主题,注重从物理角度分析文本信息和人类行为。

    • 社会科学领域:涵盖主题多样,如意见挖掘、情感分析等,不同学科研究重点不同,如艺术与人文重视自然语言处理在主题建模中的应用,商业等学科关注在线用户信息行为分析等。

    • 多学科研究领域:LDA 常用于科学发展和学科预测应用。

  • 跨边界扩散分析

    • 跨学科研究是创新扩散的重要中介,多数学科通过跨学科研究首次引用 LDA,学科在扩散中起中介作用,如计算机科学等构建主要扩散分支。

    • 创新扩散从相邻学科开始,如从计算机科学扩散到工程、商业等物理科学领域学科,不同学科领域采用时间分散,但学科兴趣相似的学科采用时间相对相邻连续,原因是兴趣相似的研究者更易合作交流,创新扩散打破学科边界,建立跨学科社交网络。


    研究结论

      • 通过主题建模揭示创新主题演变,划分创新扩散阶段,发现各阶段相互依存,同时进行,为创新扩散动态阶段研究提供新视角,主题层面研究为基于共现分析提供更细致视角。

      • 总结各学科对应主题,发现创新先扩散到相邻学科,再随主题演变转移到其他学科,跨学科研究和学科在创新扩散中起中介作用。

      主要作者简介

      翟羽佳

      研究领域:创新扩散;网络社会治理;知识发现;应急信息学


      分享者介绍

      梁悠悠

      youyou-liang.github.io

      南京大学新闻传播学院24级硕士研究生

      南京大学计算传播学实验中心成员

      研究方向:计算传播、科学学

      计算传播学园
      寻找人类传播行为的基因,通往计算传播研究之路
       最新文章