图源 | Internet
杨俊浩1 许海云1 王 超1
刘春江2 张慧玲3 谭 晓4
1.山东理工大学管理学院,淄博,255000;
2.中国科学院成都文献情报中心,成都,610299;
3.太原市图书馆,太原,030024;
4.北京市科学技术研究院科技情报研究所,北京,100089
关键词
科学突破 学科交叉 引文曲线 演化特征 动力机制 新兴研究主题
引用格式
杨俊浩,许海云,王超,等.科学突破主题的学科交叉演化特征分析[J].信息资源管理学报,2024,14(4):70-85.
01
引言
突破性创新是科技创新过程中最具前瞻性的发展方向,常伴随重大科学范式的转变,对科技发展产生重大影响,因而对其识别及预判成为当前科技情报工作的核心。前瞻识别和预测具有突破性潜力的主题,能够及时调整科技战略,合理分配研发资源,抢得发展先机,对政策制定与企业战略布局至关重要。尽早识别出重大突破需要遵循其早期产生与发展的特征和规律,这依赖于对科学突破动力机制的深度认知,目前对动力机制的认知还不够充分,其中学科交叉被认为是促进科学突破的动力之一。
当前科学工作时常跨越固有的学科边界,学科之间的界限也越来越不明显[1],一些重要科学突破的学科交叉特征日益显著。有研究认为建立在全新知识基础上的技术更可能产生突破性创新[2],也有研究表明,学科交叉与技术融合是科学突破的重要来源[3-4],不同学科之间的交汇区是极具创新潜力的地带。来自全新知识基础的创新并不多见,多数来源于已有知识的集成、组合与学科之间的交叉融合。然而,当前关于学科交叉是否能够推动科学突破尚未有定论,有研究认为学科交叉促进科学突破[5-6],也有研究发现二者并没有显著正相关甚至是负相关[7-8]。
本研究通过分析领域引文时序数据的动态变化特征,揭示新兴研究主题的突破性潜力及其学科交叉特征。首先预测新兴研究主题的突破潜力并识别科学突破主题;之后根据科学突破主题与其知识基础文献的被引量和学科交叉数量的时序状态特征进行主题类别划分及特征分析;然后分析科学突破主题及其知识基础的被引量与学科交叉数量在增减演进趋势的一致性;最后,使用传递熵分析科学突破主题和知识基础的被引量与其学科交叉数量的时间序列间的预测因果关系,进一步地揭示学科交叉对新兴研究主题突破性潜力的预测影响,探析学科交叉指标预测未来科学突破是否具有科学性。
02
研究现状
2.1 突破性创新的概念与识别方法
2.1.1 突破性创新概念内涵
突破性创新的概念起源于熊彼特提出的“创造性的破坏”(creative destruction)理论[9]。之后,在创新研究的进程中,出现了与突破性创新类似的概念,Xu等[10]辨析了学术研究中变革性创新及其相关概念的异同,发现突破性创新注重科学-技术自身的发展,而颠覆性创新更注重市场影响与市场创新。当前突破性创新研究的关注点大多集中在产品概念、技术改进、市场价值、全新的知识基础、成本的缩减以及产品性能的提高等方面。突破性创新一方面关注技术本身的突破性特征,另一方面关注创新产生的实质影响力。从技术突破出发,突破性创新是一种全新的技术,建立在一整套全新的工程和科学知识的基础之上[11],会颠覆现有的技术体系和认知[12],需要全新的科技知识和资源,是一种高度非连续性的、具有革命性本质的创新[13];从影响力出发,突破性创新能够提升产品性能、创造新产品、改变市场结构或竞争态势。一方面,突破性创新可以使现有的产品、工艺或服务具有前所未有的性能,或虽具有相似的特征但性能实现大幅提高或成本降低[14],能够创造新市场、新产品、新工艺、新产业与新的业务模式[11,15]。另一方面,突破性创新会淘汰现有技术和产品[13],改变产业竞争结构,提高绩效,节约成本[15],改变市场消费模式[16]。
本文的突破性创新侧重技术创新的动态性、不连续性和新颖性特征,关注的是创新本身所依托的全新科学知识基础和产生重大科学突破的潜力,而非对现有技术的渐进性改进。
2.1.2 突破性创新主题的识别方法
尽管引文数量不等同于文献质量,但可以反映该研究受到的关注度,而这种关注也是突破性创新成功的标志之一[17]。一个领域的知识网络包含相关的知识主题及其相互关系[18],引文网络分析法通过引文关系可以展现领域知识的发展脉络,追溯突破性创新产生与发展的引用数据,形成更完备的突破性创新主题产生与发展过程数据,因此引文分布可以用于识别突破性创新[19-20]。这类方法通过文献间的直接引用、共被引或引文耦合关系形成引文网络,利用复杂网络分析开展网络特征研究[21-22],如Dahlin等[23]利用专利引用网络的结构差异来识别突破性创新,Momeni等[24]利用文献时序引用方法构建预测模型识别早期突破性论文,Min等[25]通过引用知识网络结构的变化来识别突破性创新的研究论文,曹艺文等[20]则利用新兴研究主题的时序被引数据拟合的引文曲线特征来预测突破性创新主题。
除上述识别方法外,还可通过灾变理论描述动态系统在发展中的突变现象及突变因素间的关系[26]。例如,Xu等[27]利用灾变理论建立了突破性创新主题识别模型,并用于评估干细胞领域新兴主题的突变潜力。此外,也可使用“睡美人”文献分析法,通过分析睡美人型的论文和专利,探索此类文献中可能孕育的突破性研究[28]。这类研究聚焦“睡美人”文献唤醒机制,以期缩短突破性创新的被认可时滞[29],但有研究发现“睡美人”文献并非普遍存在,大部分突破性创新在较短时间即引起关注[22],因此该方法仅可作为早期识别的补充。
2.2 突破性创新与学科交叉的关联研究
复杂问题的解决日益需要结合不同学科领域的方法和知识。有学者认为,突破性创新依赖于已有知识,尤其是跨界知识的重组。例如,Swanson[30]提出通过发现已有知识之间未被发现的相关性来获取新知识,Nerkar[31]认为现有知识的重新整合是独特性和新颖性的重要来源,也有研究发现论文的引文数量与其对先验知识的组合能力相关[5]。特别是在科学的开放性和全球性成为当代科学主流的背景下,学科交叉与融合也越来越成为取得新突破的主要途径[32-34]。陈仕吉等[35]将学科交叉的类型或形成机制归纳为移植和聚焦两类,其中移植是学科之间协同效应形成的自组织活动,聚焦由社会发展需求导向而形成,是问题导向的学科交叉。
2.2.1 学科交叉与突破性创新
有研究认为,学科交叉是引起主题突破的重要原因[5],多学科知识的交叉融合更容易产生突破性创新[6,36]。在科学计量领域,有研究发现,科学突破研究具有显著的跨界特征[37-38],尤其是诺贝尔奖获得者会从其他学科中汲取新概念实现智力飞跃[39]。少数突破性创新建立在全新的知识基础之上,大部分是基于已有的知识,来源于科学知识的交叉融合[3]与重组集成[4],重组与交叉融合程度越高产生突破性创新的可能性越大[40]。Foster等[41]发现,在研究范式中选择冒险性研究问题比选择常规问题更容易获得认可,越是充满风险和不可能性的组合,如果能够交叉碰撞往往能带来惊喜的研究成果。技术组合和变革性突破是突破性创新产生的重要原因[6],尤其是来自不同领域未发生关联的知识间重组[42],因此有研究人员将学科交叉数量纳入突破性论文识别的预测模型中[43]。整体而言,在后研究对在先研究成果的不同组合决定了其创新性程度的大小,异常组合的研究其影响力更大。
2.2.2 引文学科多样性与科学影响力
已有研究大多使用引文学科多样性表征论文的学科交叉程度,多样性越高则学科交叉程度越大。当前关于突破性创新与参考文献多样性的看法尚存在争议。例如,有研究发现,参考文献的学科多样性与突破性创新呈正相关[44],被引用次数居前1%的论文具有更高的跨学科性,此外,在引用率偏低的研究领域中,跨学科研究的引用率也较高[45]。Okamura[46]发现增加一个学科引用可以将引文影响力提高20%,Sebastian等[38]也发现参考文献的多样性越高,论文的突破潜力就越大。但与此同时,也有研究发现,参考文献的多样性与突破性创新没有显著关系[7]甚至呈负相关[8]。例如,Rinia等[47]发现物理科学论文的跨学科性与被引总数以及平均被引次数之间存在显著负相关。Li等[48]通过多样性测量表明,获诺贝尔奖的文章的参考文献的多样性通常低于来自同一领域或主题的其他文章;Liu等[49]发现多学科合作会导致更高的参考文献学科多样性,但同时也增加了颠覆在先研究的难度。
学科交叉和科学影响之间的关系在很大程度上取决于学科交叉的程度[7,50-51]。例如,Yegros-Yegros等[51]发现多样性对科学影响有积极作用,而平衡性和差异性则有消极作用。这些发现可以有两种解释,一是结合多个领域对知识创造有积极影响,其中结合邻近领域较容易成功,而结合远端领域则风险更高;二是研究人员对开创性研究缺少信任,不愿意引用高度跨领域的论文。
综上,当前关于学科交叉是否是驱动科学突破的动因并无定论,跨学科研究通常面临更为复杂的研究问题,其研究影响力可能需要更长的时间才能体现,而时序引文数据则蕴含了主题发展的动量。已有研究大多通过相关性分析与回归分析研究跨学科、学科交叉与科学突破的关联,缺少因果关系分析。因此,本文将通过科学突破主题的被引量时间序列及其学科交叉数量序列的增减演进趋势预测因果关系,来探析学科交叉在推动科学突破中的动力机制。
03
新兴研究主题的突破性潜力与
学科交叉发展对比分析
图1为本文的研究框架,包括新兴研究主题识别、科学突破主题识别和学科交叉对突破主题的影响分析三个模块。首先识别新兴研究主题(ERT);其次根据新兴研究主题及其知识基础文献被引次数构建引文曲线,评估新兴研究主题的突破潜力,识别潜在的科学突破主题;然后根据后期知识基础文献所归属WoS的学科数量构建学科交叉曲线,根据科学突破主题及其知识基础的被引量和学科交叉数量的时序波形统计特征,使用聚类算法划分主题类别,分析不同类别的学科交叉特征及四类曲线数据间的相关性,最后进行趋势一致性分析及预测因果分析。需要指出的是模块一和模块二[20,52-53]作为本文研究的基础,已经在之前的研究中给予了详细的描述与论证,本文仅做核心内容的提炼,重点展开模块三的研究(图中红色虚线框中为本研究的目的与核心)。
图1 主题突破性与学科交叉发展关联分析流程
3.1 模块一:新兴研究主题识别
本文中新兴研究主题是一种新出现且呈增长态势的主题。结合已有新兴研究主题的识别指标,采用Xu等[52]提出的多维科学计量指标识别新兴研究主题,实现ERT的五个特征:新颖度、增长率、持久性和连贯性、潜在的高影响(即社会和经济影响)、不确定性和模糊性减少的综合计量。其中,新颖度和增长率是决定主题是否为新兴研究主题的门槛指标,其余三个作为参照指标。新颖度和增长率包含四个指标,分别是各个主题的论文数量、期刊数量、基金数量和作者数量的平均增长率[20]。其中,论文数量表征主题的研究热度,期刊数量是刊载该主题的期刊数量,基金数量表征主题被国家资助的重视程度和支持力度,作者数量表征主题受学者的关注程度。
3.2 模块二:科学突破主题识别
在曹艺文等[20]的研究基础上,Xu等[53]认为不同引文曲线之间存在关联,新兴研究主题基于其知识基础的积累、演化和交叉融合不断发展,知识基础可以代表新兴研究主题发展过程。在构建新兴研究主题引文曲线的同时,基于新兴研究主题包含文献的参考文献构成其知识基础,以时间切片形式构建知识基础引文曲线。利用引文曲线追踪并对比分析知识基础与新兴研究主题的发展模式,从知识转移和持续增长两个角度评估新兴研究主题的突破潜力,识别科学突破主题。本文基于新兴研究主题和知识基础引文曲线对突破主题的预测结果开展分析。
3.3 模块三:学科交叉对科学突破主题的影响分析
当前利用引文扩散识别科学突破的方式分为对施引文献与参考文献的分析,前者体现科学突破主题自身的发展,后者体现其知识基础的持续发展[54]。本文将综合科学突破主题所依赖的知识基础及其自身的发展态势,分析学科交叉与科学突破的关联。具体步骤如下:
(1)科学突破主题的学科交叉类别划分及特征分析
从新兴研究主题引文曲线中筛选出对应的科学突破主题和知识基础引文曲线,同时获取后期知识基础的学科交叉曲线,参考张靖雯等[55]根据引文曲线时态特征对文献进行聚类分析引文扩散模式的思路,以及科学突破主题及其知识基础被引量和学科交叉数量数据进行特征的选取,使用k-means聚类算法对主题进行类别划分,分析不同类别下主题的引文和学科交叉特征,聚类特征及其说明见表1。本文尝试通过学科丰富性、波动性和成长性指标的计算,了解学科交叉数量在时间窗口内的变化和波动,以及学科的整体发展趋势与速度,以期提供对学科水平的综合衡量。
表1 聚类特征选取及说明
(2)科学突破主题、知识基础与学科交叉的趋势一致性分析
本文通过计算科学突破主题和后期知识基础的被引量与其对应学科交叉数量的增长率(四类),利用Jaccard系数探究相同时间上增减演进趋势的一致性,由此探测学科交叉与主题发展趋势的关联。为了保证短时间内相对稳定的增长率,采用五年平均增长的方式,主要步骤为:首先,计算科学突破主题及其后期知识基础在不同年份发表文献的被引量和学科交叉数量的增长率;然后,将相同时间段内科学突破主题被引量增长率和学科交叉数量增长率、后期知识基础被引量增长率和学科交叉数量增长率进行对比,分析两组增长率组间的增减步调;最后,根据两组组间的增减步调计算每个主题的Jaccard系数,分析科学突破主题和后期知识基础的被引量与学科交叉数量的增减演进趋势是否一致。
(3)科学突破主题、知识基础与学科交叉的预测因果分析
在增减演进趋势一致性分析的基础上,利用传递熵分别析取科学突破主题、后期知识基础的被引量与各自学科交叉数量的时间序列预测因果关系,进一步揭示学科交叉对科学突破的影响程度与预测能力。
传递熵(TE)[59]是一种基于香农熵来检测两个系统之间定向信息传递的非参数信息度量方法,可以量化两个系统之间的信息传输动态及方向。传递熵是Granger因果的非线性应用拓展,在变量服从高斯分布的假设条件下,等价于Granger因果分析。因此,可以通过两变量间的传递熵分析过程变量间由于信息传递带来的预测因果关系[60-61]。具体而言,设X为科学突破主题被引量的时间序列数据,Y为对应的学科交叉数量时间序列数据,根据传递熵的概念,定义科学突破主题的学科交叉数量对主题被引量的传递熵为TEy→x,具体计算公式如下所示:
其中,
若TEy→x-TEx→y>0,则取TEy→x,表示y与x存在预测因果关系,y的变化会影响x的变化;若TEy→x-TEx→y<0,则取TEx→y,y与x存在预测因果关系,x的变化会影响y的变化;若TEy→x-TEx→y=0,则表示y与x互不影响,彼此之间不存在预测因果关系[61]。
04
实证分析
4.1 数据获取
本文以干细胞领域为例进行实证研究,于2018年10月20日检索到422,101篇论文,同时从PATSTAT数据库检索到50,556项干细胞专利。论文数据用于指标的计算,而专利数据用于计算经济社会潜在影响。为了避免数据库的扩大或缩小等随机波动的影响,采用平滑的年度发表量,选取2004年至2018年数据为研究对象,以每5个相邻年份为一组设置11个时间切片,文献发表量在时间阶段上整体呈指数增长,由于检索时间限制,2018年的文献数量略有下降。
4.2 科学突破主题识别
为了获取属于干细胞领域的主题,采用Leiden算法对文献聚类实现社区主题识别,该算法已被证明可以更好地实现社区划分,且计算速度快[62],其内部版本将所有论文分为4,047个微观主题。为了进一步深入了解干细胞领域的主题内容,利用LDA算法对每个主题的所属文献集进行文本分析,选取10个主题词作为每个主题的内容表征。在此基础上,计算各主题包含的干细胞领域论文在WoS数据库中该主题论文集中的比例,删除论文比例低的主题。同时,为确保主题与干细胞研究最直接相关,根据社区识别的主题大小进行主题过滤,提取各阶段排名前50的主题,去重后确定65个主题。在此基础上,删除出现少于三个时间间隔的主题,因其不符合新兴研究主题的持久性和连贯性特征;进一步删除开始时略有增加而后来迅速减少的主题,因其不符合新兴研究主题的不确定性和模糊性减少的特征,最终获得54个候选新兴研究主题。
结合新兴研究主题的识别指标进一步筛选:首先,计算每个候选新兴研究主题的论文数量在各阶段的增长率,再计算全阶段的平均增长率,排除近期消失的主题;其次,计算各主题的期刊、基金和作者数量在全阶段的平均增长率,剔除其为空值的主题;最后,剔除论文数量在后5个阶段平均增长率为负值的主题,综合分析筛选得到26个新兴研究主题。关于26个主题的标签和简要描述详见附录A,详细描述可参见Xu等[52]的研究。
在识别新兴研究主题的基础上,进一步识别将具有突破潜力的主题作为科学突破主题,根据新兴研究主题的突破预测结果,共得到21个科学突破主题,详见附录A。
需要指出的是,本研究中ERTs的引文曲线时间为2001—2017年,知识基础的引文曲线时间为1990—2017年,时间跨度较长,为了更好地理解和对比分析知识基础和ERTs的发展模式,将知识基础分为前期知识基础(EKB)(1990—2000年)和后期知识基础(LKB)(2001—2017年)。进一步,获取科学突破主题和后期知识基础中文献所归属的WoS学科分类,统计学科交叉数量,构建学科交叉曲线,文献覆盖的学科数量越多,则该主题的学科交叉数量越多。
4.3 科学突破主题的学科交叉类别划分及特征分析
首先,根据科学突破主题和知识基础的被引量与学科交叉数量数据,对上述时序引文曲线波形统计的特征进行计算后,使用最小-最大缩放进行标准化,利用Davies-Bouldin指数确定最佳聚类系数为3,进行k-means聚类后得到三个类别,然后根据科学突破主题和知识基础的引文曲线、后期知识基础学科交叉曲线的可视化和特征数据进行不同类别下特征的分析。在下文的主题曲线图中,引文曲线图表示不同年份发表的知识基础或科学突破主题文献的被引次数随时间变化的情况,学科交叉曲线图表示不同年份发表的后期知识基础文献的学科数量随时间变化的情况。之后,计算科学突破主题的四类曲线数据的Pearson相关系数,分析曲线数据间的相关性。
类别一:科学突破主题、LKB、EKB整体呈上升趋势,学科范围窄波动小。该类别下科学突破主题及其EKB、LKB引文曲线整体呈上升趋势但近期呈下降趋势,且引文波动整体较大,同时被引速率较低,说明被引次数的累积速度较慢。EKB年均被引量整体较低,而LKB年均被引量整体偏高,科学突破主题年均被引量较为分散,范围在1649—11764;EKB有两个主题波峰为1,LKB都是一个波峰,两者的最大波峰值均较高且出现时间较晚,而科学突破主题无波峰出现。学科丰富性整体偏低,学科成长性大多为负但不算太低,学科波动性整体较低,说明该类别科学突破主题的知识来源范围较窄,学科交叉发展呈缓慢下降趋势,波动范围较少。该类别包括主题2、921、1460,以主题921为例,对其曲线进行可视化展示,如图2所示。
图2 主题921曲线图
类别二:EKB波动发展,LKB、科学突破主题呈上升趋势,学科范围窄波动大。该类别下EKB引文曲线整体呈波动式发展但引文波动整体较小,年均被引次数较高,LKB和科学突破主题引文曲线整体呈上升趋势,但近期呈下降趋势,引文波动整体较小,LKB年均被引偏高,但科学突破主题年均被引两极分化且小于LKB的年均被引,另外,三者被引速率都较高说明被引频次累积的速度较快。EKB波峰数较多且最大波峰值偏高,LKB为一个波峰,但最大波峰值两极分化,同时两者最大波峰出现时间均偏早,而科学突破主题无波峰出现。学科丰富性整体偏高,学科成长性为负且整体较低,学科波动性整体较高,说明该类别科学突破主题的知识来源范围较广,学科交叉整体呈下降趋势,且波动范围较大。该类别包括主题221、581、814、867、965、1095、1142、1199,以主题867为例,进行曲线可视化展示,如图3所示。
图3 主题867曲线图
类别三:EKB先上升后下降,LKB、科学突破主题呈上升趋势,学科范围广波动小。该类别下EKB的引文曲线呈现先上升后下降趋势,EKB波峰出现1—3次,最大波峰值较高且出现时间整体较早,年均被引次数和被引速率分布较为分散。LKB和科学突破主题引文曲线整体呈上升趋势,但近期略有下降,被引速率整体偏低,说明LKB和科学突破主题被引次数的累积速度较慢,两者都无波峰出现,且三者引文波动均较大。学科丰富性整体偏高,学科成长性大多为负但整体偏高,学科波动性整体较低,说明该类别科学突破主题知识来源的学科范围较广,学科交叉呈平缓下降趋势,波动范围较小。该类别包括主题60、107、161、254、353、648、710、1046、1290、2276,以主题60为例进行曲线可视化展示,如图4所示。
图4 主题60曲线图
分别计算21个科学突破主题的四类曲线数据间的Pearson相关系数,以热图形式表示计算结果,如图5所示,其中a、b、c、d分别表示前期知识基础引文、后期知识基础引文、科学突破主题引文和后期知识基础学科交叉数据,0到1之间的系数使用蓝色表示,0到-1之间的系数使用红色表示,图形颜色深浅及大小与相关系数的绝对值相关。21个主题的后期知识基础引文、科学突破主题引文和学科交叉之间都具有显著的正相关性,且相关性较强,前期知识基础引文与其他三类曲线间的相关性在三个类别中并不一致,类别一中呈现显著正相关性,而类别二和类别三中呈现不具有显著相关性或呈负相关性的情况,一定程度上与上述类别的特征相一致。
图5 四类曲线数据间相关性热图
4.4 科学突破主题、知识基础与学科交叉的趋势一致性分析
表2为科学突破主题、后期知识基础的引文与其学科交叉的增减演进趋势一致性指标计算结果,科学突破主题和后期知识基础的被引量与其学科交叉数量在相同时间上增减步调的Jaccard系数整体较高,说明科学突破主题在被引量与其学科交叉数量的增减演进趋势上存在较高的一致性,同样,后期知识基础被引量与其学科交叉数量在增减演进趋势上也存在较高的一致性。使用雷达图得到直观的结果(图6),该图中科学突破主题与后期知识基础二者重合部分较大,说明科学突破主题与后期知识基础在被引量和学科交叉数量增减演进趋势上具有类似的变化。
表2 科学突破主题及其知识基础引文与
学科交叉增减演进趋势的一致性系数
图6 科学突破主题、知识基础与学科交叉的一致性
4.5 科学突破主题、知识基础与学科交叉的预测因果分析
本文利用R中的RTransferEntropy包[63]进行两种方式传递熵的计算。第一种方式是根据其时序数据计算每一年相应的传递熵,第二种方式是合并时序数据计算总体传递熵。结果显示,第一种方式的结果具有较大随机性,未出现显著模式。因此,采用第二种方式计算科学突破主题及其后期知识基础的被引量时间序列与其学科交叉数量时间序列间的传递熵,进一步研究其预测因果关系。
根据公式(2)得到科学突破主题及后期知识基础的被引量时间序列与其学科交叉数量时间序列间的关系强度指数DI,最终结果见表3,其中,AX和BX分别为科学突破主题及其后期知识基础的学科交叉数量时间序列,AY和BY分别为科学突破主题及其后期知识基础的被引量时间序列,DIa和DIb分别为科学突破主题和后期知识基础的关系强度指数。为了直观显示预测因果关系的方向性,将表征学科交叉数量时间序列影响被引量时间序列发展的关系强度指数设置为正,反之为负。
由表3可知,科学突破主题被引量与其学科交叉数量的序列间传递熵结果大多数为0,在传递熵不为0的主题中,科学突破主题学科交叉数量与其被引量的序列间关系强度指数大多为正,说明科学突破主题学科交叉数量序列的发展影响了其被引量序列的发展,包括主题107、867、1460,且这些主题的关系强度指数值都为0.3174,说明这些科学突破主题中的影响强度相同。另外存在关系强度指数为负的主题,说明主题2被引量序列的发展影响了该主题学科交叉数量序列的发展,但是从数值来看,这种影响关系不强。从整体结果看,科学突破主题被引量与其学科交叉数量的时间序列间预测因果关系并不明显,大多数主题被引量与其学科交叉数量的时间序列间并不存在预测因果关系。
通过后期知识基础的计算结果发现,后期知识基础被引量与其学科交叉数量的序列间关系强度指数都不为零且大多为负,说明后期知识基础被引量与其学科交叉数量的序列间都存在预测因果关系,只有主题2后期知识基础学科交叉数量序列的发展影响了其被引量序列的发展,但这种关系不强。对其他主题来说,则是后期知识基础被引量序列的发展影响了其学科交叉数量序列的发展,但影响强度不同,主题921、1199、1290、1460后期知识基础被引量序列对其学科交叉数量序列的影响更强。
表3 科学突破主题及知识基础与其学科交叉的关系强度指数
05
讨论与结论
5.1 主要结论
学科交叉对科学突破的影响及其程度是科学突破动力机制研究的重要内容。本文通过引文分布特征识别领域科学突破主题,对科学突破主题、知识基础与学科交叉发展的不同类别进行分析,探究科学突破主题的学科交叉演化特征通过一致性分析与预测因果分析相结合,探析学科交叉对科学突破的影响机制。实证分析根据干细胞领域的科学突破主题及其知识基础的被引量和后期知识基础学科交叉数量的特征进行聚类,总共划分为三个类别:类别一:科学突破主题、LKB、EKB整体呈上升趋势,学科范围窄波动小;类别二:EKB波动发展,LKB、科学突破主题呈上升趋势,学科范围窄波动大;类别三:EKB先上升后下降,LKB、科学突破主题呈上升趋势,学科范围广波动小。上述类别中,大多主题成长性指标计算结果为负,可能是因为较早年份发表的文献经过发展,其学科均值整体较高且呈现下降趋势,而近期发表的文献还处于发展中,虽然可能处于上升趋势,但其学科均值较低,从而造成主题成长性整体为负。不同类别的被引量和学科范围存在差异,利用Jac-card系数计算科学突破主题及其后期知识基础的被引量与其学科交叉数量在相同时间上增减演进趋势的一致性系数,发现两者存在较高的趋势一致性。
同时,利用传递熵探究学科交叉数量时间序列对科学突破主题与后期知识基础被引量时间序列间的预测因果关系,发现学科交叉数量序列与科学突破主题及后期知识基础被引量序列间存在预测因果关系但并不明显,且大多数主题被引量序列与其学科交叉数量序列间并不存在预测因果关系。
本文为更好地理解科学突破研究的特征提供了有用的线索和有益启示,推动了对科学突破动力机制的探索。结合已有研究可以发现,在学科分化日益精细的条件下,颠覆性创新也变得更为困难。在此背景下,学科交叉是带来新颖性与颠覆性创新的重要路径之一,但与此同时,相距越远的领域在相互沟通与扩散上存在更大的障碍,交叉融合的风险更大。学科交叉可以促进更高程度的创新,但学科交叉既不是发生科学突破的充分条件也不是其必要条件。因此,在科学突破主题识别与预测中,不能仅用学科交叉数量指标识别或预判研究领域科学突破主题,而需具体分析交叉的方式与语义内涵。
本研究存在以下不足:利用引文增长预判科学突破主题,由于存在引用的逐热行为造成一段时间的引文量攀升,可能最终不会带来真正的突破。此外,科学突破可能受多种因素的相互推动或制约,而传递熵仅能揭示两变量间的非对称信息传递,是时序预测中的因果分析,并非逻辑学上的因果关系,因此尚不能解析学科交叉与科学突破主题引文间详细的因果作用机制,也无法区分直接和间接的因果关系,未来对科学突破动力机制的探究还需继续深入。
5.2 未来研究
未来可以从以下三个方面继续探究学科交叉与科学突破之间的关联,以期进一步推进对科学突破动机机制的认知。
(1)深入分析学科交叉的驱动因素及实现方式。一方面,通过文本语义分析进一步挖掘引用内容与引用动机,探究学科交叉与科学突破的关联。既要分析学科交叉的动机——解决具体问题还是探索新的研究范式,更要深入分析学科交叉研究的动因;另一方面,在使用学科交叉预测科学突破时,需要具体分析学科交叉的方式、跨学科的交叉与组合形式,分析哪种模式下的交叉组合形式更容易引起突破性创新,以期识别能够推动科学突破的学科交叉。
(2)识别远端知识间的交叉模式与可达路径。远端知识之间的交叉可视为不同知识领域存在更长的关联路径,未来可以通过打通远端长路径的知识关联,探究远端的知识成功交叉的模式与机制。此外,还可以探索包括主题内容的交叉与科学团队之间的合作,尤其是借助大数据与人工智能技术识别潜在长路径交叉领域,降低远端知识交叉与融合识别的障碍,发现有价值的交叉与融合的可达路径,推动潜在科学突破的关联组合。
(3)探究长链路径与多路径中的关联和因果机制。以新兴研究主题为起点,包含知识基础、知识基础学科交叉、新兴研究主题学科交叉、新兴研究主题的突破和突破的学科交叉的长链关联与因果驱动分析,例如,知识基础→知识基础的学科交叉→新兴研究主题的学科交叉→新兴研究主题的突破这样一条创新路径的相似与因果驱动关系。在此基础上,考虑将更多影响因素纳入到分析,以多路径视角探究相似关联,并深入探究可行的逻辑因果分析方法,利用因果研究解析多路径中的因果驱动关系,尤其是长链路径中蕴含的相似与因果驱动机制,不断深化对科学突破机制的认知。
附录内容获取请邮件联系:yangjunhao163@gmail.com。
参考文献
作者简介
*原文载于《信息资源管理学报》2024年第4期,欢迎个人转发,公众号转载请联系后台。
* 引用格式
杨俊浩,许海云,王超,等.科学突破主题的学科交叉演化特征分析[J].信息资源管理学报,2024,14(4):70-85.
往期 · 推荐
制版编辑 | 周凡倩
审核 | 于 媛
长按识别二维码关注我们
信息资源管理学报
分享、在看与点赞
只要你点,我们就是朋友😊