图源 | Internet
张佳锐1,2 康乐乐1,2 孙建军1,2
1.南京大学数据智能与交叉创新实验室,南京,210023;
2. 南京大学信息管理学院,南京,210023
关键词
专利创新 知识流动 科学-知识 新近性 时域性 专利影响力
引用格式
张佳锐,康乐乐,孙建军.科学与技术知识融合中的新近性与时域性作用研究[J].信息资源管理学报,2024,14(4):86-102.
引言
作为新技术发明的重要载体,专利创新一直受到产业界与学术界的广泛重视[1-2]。现有研究将引用关系视作知识流动的过程,认为专利创新依赖于对现有知识进行的创造性吸收,因专利所引用知识的来源属性[3-6]与时间属性[7-9]是影响专利创新的重要因素。专利创新中的知识来源,主要包括以专利为主体的技术知识以及以科学文献为主体的科学知识。相关研究发现,吸收科学知识并与技术知识进行一定程度的融合有利于专利创新[10-11]。然而,专利融合的科学知识与技术知识的时间属性分布特征,及其是否会对专利创新活动产生影响还没有得到系统的回答。现有研究大多集中于特定领域专利的单一知识来源[2,5,7]或者单一时间属性[7-8] ,缺少对科学与技术两种知识时间属性的系统性探索分析。
知识的时间属性是指创新活动所引知识在时间上的分布情况,在文献计量领域往往采用引文时滞来表示[12-13],施引文献的延迟认可、科学知识扩散速度与科学引用时滞等是科学引文的研究热点[12]。此外,专利创新的相关研究也关注创新活动中吸收的技术知识的新近程度测度,并一定程度上探究其对创新结果的影响[9,14-15]。尽管现有研究进行了探索,但只局限在单一知识来源(如科学知识[12]或技术知识[9])。因此,分析专利所吸收的科学与技术知识的时间属性分布,有助于从时间属性视角来揭示专利融合两种知识的现状。
专利创新活动被认为是风险与收益并存的活动,而专利影响力的不确定性可以被用于衡量专利创新吸收不同类型知识的风险[16-17],专利影响力的离散程度越大,说明专利创新的不确定性越高,风险也越大。在专利知识来源与其影响力不确定性的关系方面,March[17]认为知识重组可以提高专利创新获得突破性成果的概率,但也同样可能导致创新的失败。Lee[16]研究知识重组与专利创新的不确定性的关系发现,利用过多新技术知识的组合会提高专利引用的不确定性。Wang等[18]则发现过于新颖的知识会提升论文被引次数的不确定性,进而提升创新风险。然而,针对专利对科学与技术知识吸收的时间属性是否存在类似效应,仍需要进一步的探索与分析。
基于上述研究现状,本研究利用专利的引文来识别专利对科学与技术知识的吸收。在以往引文时间属性测度的研究基础上,利用引文时滞,提出知识的新近性与时域性两个指标来描述专利吸收知识的时间属性。其中,新近性是指吸收知识的时间新近程度,时域性是指吸收知识的时间跨度[9]。具体而言,本研究以PATSTAT专利数据库中申请时间在1979—2013年且同时引用专利与论文的2,563,948项目标专利及其6,693,213项引用专利以及3,978,556篇引用论文进行实证分析,探究专利对科学与技术知识吸收的时间属性的分布情况以及其对专利影响力不确定性的影响。首先,在宏观角度,对专利吸收科学和技术知识的新近性与时域性进行测度,并分析其时间分布、领域分布与专利申请人类型分布,揭示专利吸收两种知识的时间属性特征及其现状;其次,在微观角度,利用广义负二项回归模型,探究专利吸收不同知识来源的新近性与时域性对专利影响力不确定性的影响,从而揭示专利创新中,科学与技术知识的不同时间属性对专利影响力不确定性的影响机制。
相关研究
2.1 专利创新中所吸收的科学与技术知识
在专利创新中,引用专利发明被认为是吸收技术知识,而引用科学论文则被视为是吸收科学知识[10,19]。科学知识对专利发明的影响已经得到了学者的重视。Mukherjee等[20]对1998—2017年间美国专利商标局授权的专利进行分析发现,与科学相关的专利数量的增长率是被引专利和科学论文数量增长率的两倍。而进一步的探索研究发现,不同属性的科学知识对专利发明有着不同作用。Ke[7]通过研究生命科学领域的论文发现,基础性和创新性更强的论文更有可能被专利引用,进而推进技术创新。此外,基于生命科学类的专利数据,Ke[21]发现引用科学论文的强度与专利的影响力间存在着正向关系,这一关系在基础科学领域内更为显著。
除了分析单一的科学知识来源对专利创新的影响,已有研究还对科学与技术双重知识来源给予了关注。例如,孔嘉等[6]利用多领域专利数据,描述了各领域专利的“科学-技术”知识融合现状,并发现科学知识广度与专利被引量存在倒U型关系,技术知识广度与专利被引量存在U型关系。Du等[22]提出“资助-科学-技术-创新”模式,并指出为了实现成功的药物创新,专利需要与科学基础研究进行中等水平的融合。孙晓玲等[23]从专利价值角度切入,通过表示学习的方式对人工智能领域专利的科学-技术关联度进行分析发现,高价值专利的科学-技术关联度远高于一般专利。高继平等[24]通过建立纳米科学领域的论文与专利的共被引网络,研究了共被引网络中知识系统的流动,并发现技术发展更依赖于技术知识,但在技术发展初期,科学知识有着更大的作用,且有更高的知识活力。
上述研究证明了专利创新中的科学知识与技术知识同样起到了重要作用,指出了在特定领域的专利创新中技术知识与科学知识作用的区别,并发现一定程度的技术知识与科学知识的融合有利于专利创新。在上述研究的基础上,本研究进一步拓展不同来源知识的影响研究,探究不同来源知识在多领域的专利创新中的普遍规律,并关注跨领域的两类知识的流动。
2.2 专利创新中知识流动的时间属性
现有研究对于知识吸收中的时间属性研究主要集中于“专利-论文”以及“专利-专利”的引用时滞分布分析,着重探索引用时滞的影响因素以及对比两类引用时滞的规律。在影响因素研究中,Adams等[13]研究1981—2010年间的“专利-论文”的引用时滞发现,引用时滞随着论文的复杂性、重新搜索的路线、领域的年龄以及出版提交的滞后期而增加,而随着团队的规模而减少。在两类引用时滞规律研究方面,Fukuzawa等[25]分析日本生命医学领域前1,000名学者的4,763篇论文发现,“论文-论文”的引用时滞为4年,而“专利-论文”的引用时滞为6年,“专利-论文”间的知识流动速度相对较慢。Finardi[26]研究了纳米科学与纳米技术领域的知识转移速度,通过“专利-论文”的引用时滞发现,纳米领域的科学知识产生到技术利用的时间周期为3—4年。van Raan等[12]研究“专利-论文”引用中的“睡美人”现象发现,存在“睡美人”现象的论文在近年间越来越多地被专利引用唤醒,而非被科学论文引用唤醒。
此外,部分研究将专利的引用时滞作为专利影响力的体现。例如,Fisch等[27]将专利引用时滞作为专利影响力的衡量方式,研究2000年至2010年间的60,000项专利发现,中国申请的专利引用时滞长于美国等国家,存在着明显的引文滞后,即专利的影响力相对较低。Kwon等[28]同样进行了国家间专利引用时滞的对比研究,并发现相对于美国而言,韩国等亚洲新兴经济体在专利质量、引用时滞等方面都有了大幅的追赶。Lee等[29]将专利的首次被引时滞作为其经济价值的体现,并发现专利的IPC分类、专利族、技术周期以及引用专利数都与专利的首次被引时滞有关;具有非常规技术核心的专利首次被引时滞较长;专利的科学关联度与首次被引时滞存在着U型关系。
上述研究从时滞角度探究了专利创新中所吸收知识的时间属性,以及不同国家与领域间在引用时滞上的区别,并发现了引用时滞在一定程度上与专利创新活动的质量或者复杂程度相关。本研究将进一步探究不同技术领域、不同发明人类型在专利创新活动时间属性方面的区别。
2.3 专利创新活动吸收知识的时间属性效应
除了探索时间属性,分析时间属性的效应也同样重要。在本研究中,时间属性的效应是指专利所吸收知识的新近程度与时间跨度所带来的影响。Kok等[14]从组织学习的角度对燃料电池领域的专利技术知识重组进行研究发现,技术知识重组的时滞与专利的影响力间存在U型关系。Strumsky等[15]聚焦公司的专利创新活动中所吸收知识的新颖程度与其金融市场表现间的关系发现,利用过于新颖的知识会对企业的金融市场表现产生负面影响。Wang等[30]以68家从事专利技术许可的中国高科技公司为样本,发现其专利的引用时滞对公司的创新成果具有负向影响。Nerkar[9]从知识创造角度,综合研究了“专利-专利”的引用时滞以及引用时间跨度两个维度对专利影响力的作用,并发现同时利用过于新近的技术知识以及过于大跨度的技术知识会降低专利的影响力。
整体而言,已有研究主要从技术知识的角度探究了特定领域专利创新活动所吸收知识的时间属性效应。研究发现,对于技术知识而言,过长或者过短的引用时滞以及时间跨度都会对专利创新的结果产生负面影响。而对于科学创新活动的研究发现,引用吸收过于新颖的知识会导致科学创新的不确定性增强[18]。但是,当前缺乏同时从科学知识与技术知识两个维度,探究知识新近性如何影响创新不确定性,以及不同来源的知识是否均存在上述效应的研究。除知识的新近性之外,引用知识的时间跨度即(“时域性”),也可能对专利创新产生影响,但是同样缺乏从科学知识与技术知识两个维度,探究知识时域性如何影响创新不确定性的研究。
因此,本研究将同时考虑专利创新中科学知识与技术知识的时间属性,并进一步从专利影响力的不确定性角度探究与阐释不同的时间属性对于专利创新的影响。
数据与研究方法
3.1 数据源与数据处理
为了更精确地识别专利吸收的科学知识,本研究仅采用专利引用的科学论文。本研究的主要分析单元是目标专利及其引用的专利(cited patent)和论文(cited paper)。其中,专利数据以及专利间的引用关系来源于全球专利统计数据库PATSTAT(Worldwide Patent Statistical Database),该库包含了自19世纪以来的全球范围内的专利信息,也是全球范围内主要的专利信息来源之一。而专利对论文的引用数据来源为Marx[19]构建的“Patent-Paper”数据集(Reliance on Science Dataset,ROSD),该数据集通过识别1800年以来申请且授权的专利文档中引用的科学论文,建立了专利与论文间的引用关系。
图1为研究数据的构建过程:①利用专利识别号,结合PATSTAT数据库与ROSD数据集,选择申请年在1979—2013年间的专利作为目标专利,进一步匹配其专利引用数据、专利技术领域以及专利发明人信息;②匹配专利引用论文的引用时间、论文科学领域等信息;③整合以上数据,构建本研究所需数据集,包括2,563,948个目标专利、6,693,213个引用专利以及3,978,556篇引用论文。
图1 数据来源及匹配过程
3.2 相关指标构建
根据已有文献,本文将技术知识吸收定义为对专利的引用,将科学知识吸收定义为对论文的引用。具体而言,研究将从知识新近性和知识时域性两个视角,分析知识吸收不同来源的时间属性对于专利影响力的不确定性的影响。其中,新近性是指目标专利所吸收的知识与目标专利本身的时间接近程度;而时域性是指目标专利所吸收知识的时间跨度。本研究将参考Nerkar[9]的测度方法,将知识的新近性与时域性分别定义为对专利与论文的引用时滞以及对专利与论文的引用时间跨度。
(1)知识的新近性
专利引用时滞与技术循环时间[8]常常被用于衡量专利间技术知识流动的快慢。在现有测度指标的基础上,本研究通过专利引用知识的新近性来衡量目标专利与所吸收知识的时间距离。对于技术知识而言,技术知识引用新近性(TechRecenty)定义如公式(1)所示。其中,目标专利i(i=1,2,…,N),引用专利ij (j=1,2,…,Mi),不同的目标专利对应不同的引用专利组与引用专利数量,Tij与Ti分别表示引用专利ij与目标专利i的专利申请年,MaxTech为所有“专利-专利”引用关系中目标专利与引用专利间的时间差的最大值。TechRecentyi越大,表示专利i的技术知识新近性越高。假设目标专利i引用的专利分别为
同理,科学知识引用新近性(SciRecenty)定义如公式(3)所示。目标专利i(i= 1,2,…,N),引用论文ik(j=1,2,…,Wi),不同的目标专利对应不同的引用论文组与引用论文数量,Tik与Ti表示引用论文ik的发表时间与目标专利i的专利申请年, 而Maxsci为所有“专利-论文”引用关系中,目标专利时间与引用论文发表时间差的最大值。SciRecentyi越大,表示专利i的科学知识新近性越高。假设目标专利i引用的论文分别为
(2)知识的时域性
本研究使用专利引用知识的时域性来衡量专利引用的时间分布范围,其中技术知识引用时域性(TechSpread)定义如公式(5)所示。其中目标专利i引用专利ij (j=1,2,…,Mi),Tij与Ti分别表示专利ij与专利i的专利申请年,IQR 表示四分位距(Interquartile Range),TechSpreadi越大,表示专利i的技术时域性越强。假设目标专利i引用的专利分别为
同理,科学知识引用时域性(SciSpread)如公式(6) 所示。其中专利i引用论文ik (j=1,2,…,Wi),Tik与Ti表示论文ik的与Ti表示论文ik的发表时间以及专利i 的专利申请年,IQR 表示四分位距(Interquartile Range),SciSpreadi越大,表示专利i的科学时域性越强。假设目标专利i引用的论文分别为
(3)专利影响力
专利的被引次数被普遍用于衡量专利的影响力。为了避免专利申请时间带来的引用量在统计时长方面的差异,本研究采用专利公开后五年内的被引次数作为专利影响力的衡量指标[31]。对于专利i(1,2,3,…,N ),其专利影响力计算公式为:
(4)专利影响力的不确定性
专利影响力的不确定性指的是专利影响力在观测值中的分布离散程度。本研究使用专利的被引次数以衡量专利的影响力,使用专利被引次数的方差作为衡量专利影响力不确定性的指标,具体定义如下:
(5)专利与论文的领域
对于目标专利与引用专利的技术领域分类,本研究采用了世界知识产权组织(WorldIntellectual Property Organization, WIPO) 的专利技术领域分类,该体系包含35 个技术领域。在PATSTAT 数据库中, 同一专利可能会对应多个不同的技术领域,专利所属不同领域的总权重之和为1。在涉及技术领域的专利数量统计时,每个技术领域的专利数量等于属于该领域的所有专利的权重之和。而科学论文的领域识别则采用经济合作与发展组织 (Organization for Economic Co-operationand Development,OECD)的科学领域分类,共包含39个科学领域,将每篇科学论文分配至唯一的科学领域。
(6)其他变量
除此以外,本研究还有其他相关控制变量,所有变量的具体描述见表1。
表1 研究中涉及的变量
知识吸收的新近性与时域性分析
4.1 时间演化分析
基于构建的数据集,统计得到目标专利在1979—2013年之间,对科学知识和技术知识吸收的新近性和时域性分布如图2所示。从整体的时间维度来看,1979—2013年间专利所吸收知识的新近性以及时域性在不同的知识来源中表现出了相似的趋势。
对于专利吸收知识的新近性而言,技术知识相较于科学知识更为新近,这说明技术创新中的技术知识到技术知识的流动略快于科学知识到技术知识的流动。在1979—2000年间,专利创新活动的新近性逐年增强,对于新知识的利用率逐年上升;而在2000—2013年,专利创新的新近性出现显著的回落,对于新知识的利用变得更为保守。而对于专利吸收知识的时域性而言,其吸收的科学知识的时域性明显低于技术知识,在技术知识与科学知识之间,专利创新更倾向于对技术知识进行长时间区间的回溯利用。在1979—2013年间,专利创新吸收知识的时域性逐年提升,其中科学知识的时域性在35年间始终保持明显的上升趋势;而技术知识的时域性则在1979—2000年间基本保持稳定,2000年后才出现明显的上升趋势。
图2 科学与技术知识的新近性、时域性总体变化
4.2 技术领域分析
过去的研究表明,不同技术领域的专利在对已有专利或论文的引用强度方面有着不同的表现。在技术创新中,不同的技术领域可能在对已有的知识利用吸收上具有不同的特征。本研究使用了WIPO技术领域分类号对数据集中的目标专利进行分类,共包含5个主领域及其下属的35个子领域。表2展示了不同主技术领域的新近性与时域性指标。
表2 科学和技术知识的WIPO主技术领域分布
WIPO技术领域分类的主领域为电子工程、仪器、化学、机械工程与其他等五个领域。其中,电子工程领域所吸收的技术知识最为新近,之后依次为仪器领域、化学领域、机械工程领域以及其他领域,表明电子工程领域对于利用新技术知识的态度更为积极。而在科学知识的新近性方面,电子工程领域同样吸收了最新近的科学知识,表明电子工程领域科学知识可在较短的时间内转化为技术创新。而化学领域则对于新科学知识的利用程度最低,表明化学领域的科学技术转化周期较长。在技术知识与科学知识的时域性方面,电子工程领域同样时域程度较小,而化学领域所吸收知识的时域性较高。此外仪器领域吸收的知识具有较高的科学时域性,较低的技术时域性;而机械工程领域则恰好相反。
表3、图3与图4进一步展示了35个WIPO技术分类子领域的知识吸收的新近性与时域性情况,并基于新近性与时域性的均值,划分象限进行分析。与上述主领域分析结果类似,数字通信与电信等归属于电子工程领域的子领域有着最高的技术知识与科学知识新近性,主要处于“高科学、高技术新近性”象限;而土木工程等归属于机械工程与其他领域的子领域则主要分布在低技术新近性象限。而食品化学等归属于化学领域的子领域,虽然其吸收的科学与技术知识的新近性程度均不高,但是却表现出了较高的科学时域性,其利用了时间跨度更大的科学知识。
表3 1979—2013年间各技术领域科学与技术知识新近性与时域性的数量分布
图3 专利吸收知识新近性在技术领域的分布
图4 专利吸收知识时域性在技术领域的分布
4.3 专利发明人类型对比分析
除了专利的技术领域,专利创新活动中发明人的类型也会对创新过程产生影响,且不同类型的发明人对已有知识的吸收存在不同的偏好。图5展示了以企业、政府与非营利组织、高等院校以及个人作为第一发明人的专利所吸收的技术与科学知识的新近性与时域性的逐年分布。
在吸收技术知识的新近性方面,高等院校吸收利用了最新近的知识,其后分别为政府与非营利组织、企业与个人。对于企业与个人而言,出于利润考虑,其对于专利研发的风险承受能力可能较弱,因此在研发过程中可能不会吸收最为新近且存在风险的知识。而在吸收科学知识的新近性方面,存在着与技术知识相似的分布。高等院校与政府及非营利组织的专利创新活动倾向于吸收较为新近的科学知识,而个人与企业的专利创新活动吸收知识的新近性则相对较低。高等院校与政府及非营利组织的专利创新活动包含许多的科研成果转化,因此可能会对最新的科学知识较为敏感,而企业与个人则相对远离科研活动,难以及时利用最新的科学知识。
在吸收技术知识的时域性方面,不同类型发明人的分布与新近性相比存在较大差异,高等院校与政府及非营利组织的技术时域性低于个人与企业。而在吸收科学知识的时域性方面,不同类型发明人的分布与新近性相比同样存在较大差异,不同类型发明人的专利的科学知识时域性都有着整体上升的趋势。其中企业与政府及非营利组织的科学时域性较低,而高等院校的科学时域性最高,表明高等院校的专利创新活动会更为广泛地利用不同时间段的科学知识。而个人的专利创新活动的科学知识时域性则在不断上升,甚至在2004—2011年间超越了高等院校,这表明个人发明人对于科学知识的利用在变得更加广泛,而不仅仅局限于最近时间段的科学知识。
图5 1979—2013年间不同发明人类型所利用科学与技术知识新近性与时域性的数量分布
新近性与时域性对专利影响力的不确定性效果
5.1 负二项分散模型
专利引用知识的新近性表明其是否及时吸收了最新的科学与技术知识。那些能够及时注意到最近科学和技术发展的专利,更有可能在应用过程中获得巨大的成功,从而产生广泛的影响。但是,很多情景下运用新近的知识意味着冒险,因为新近的知识可能没有得到充分的检验,在应用过程中存在较差的实用性,无法取得实践中的成功,导致专利影响力反而低于那些进行保守创造的专利。同样,对于时域性也有着类似的情况。某个专利引用的时域性较高,意味着其吸收了长时间跨度的知识,能够在充分了解过去知识基础的情况下开展发明创造工作,从而使发明专利具有更大的影响力。但是,高时域性意味着相关创造发明方向一直被关注,新的发明创造只是在已有基础上的延伸拓展,无法产生颠覆性的成果。因此,本研究认为,高新近性与时域性使专利的影响力存在更大的不确定性。
为分析新近性与时域性对专利影响力不确定性所带来的影响,本研究采用Lee[16]所提出的负二项分散模型(Negative binomial count and dispersion model)。该方法主要对自变量所带来的因变量方差变化进行估计,被应用于对风险、不确定性等估计的研究[16,18,32]。传统负二项回归模型假定对于每个值进行估计时,其方差和均值的比值为恒量,即在估计的每个点上,方差并不随着均值而变动。已有研究发现,学术论文价值的不确定性和论文的新颖性之间存在线性关系[18]。在学术新颖度较低的学术论文组中,被引次数之间差异较小、方差较低;但是,在有较高学术新颖度的学术论文组中,被引次数之间差异明显加大。专利所吸收知识的时间属性对于专利的影响力也可能有着类似的效应。
为解决衡量不同变量对专利影响力的影响问题,Cameron等[33]在负二项模型Negbin I的基础上提出了Negbin II模型,该模型为广义负二项回归模型的一种;Lee[16]进一步将其拓展为负二项分散模型,并应用于技术创新中专利影响力的不确定性研究,其允许独立地估计自变量对于因变量的预测均值与方差的影响。
对于本研究而言,专利引用次数作为典型的计数变量,需要使用计数模型进行统计估计。此外,专利引用次数具有较大的离散程度,不满足泊松分布均值等于方差的要求,因此需要使用负二项分布模型进行估计。Lee[16]提出的负二项分散模型,在本研究中可以用于估计不同时间属性的知识对于专利影响力不确定性的影响。因此根据这一方法,本研究采用下述公式进行统计估计。
此模型估计分为两个部分,一个部分为基本的负二项回归估计,由公式(9)、(10)与(11)表示。其中,负二项回归模型的概率分布(9)在泊松模型的基础上,加入了随机变量σi,以表示误差项,并使预测的平均值根据误差项的分布而变化。随机变量服从参数为的gamma分布(10),并最终得到由(11)表示的概率密度分布函数。本研究采用的负二项分散模型在用xi预测yi发生的概率时,采用上述基本的负二项回归模型相关公式。
而模型的方差部分则不同,基本的负二项回归模型Negbin I的方差均值为常量,而负二项分散模型的估计量方差与均值的比值随着均值提升而线性变化。公式(12)表示了负二项分散模型的条件方差,其中α是vi的倒数,被称作离散参数。本研究将α作为模型的参数,通过最大似然估计对其进行估计,从而对因变量的离散程度进行建模,衡量自变量对于专利引用次数离散程度的影响。对α存在正向效应的变量将会增大专利引用次数的离散程度,从而提升专利影响力的不确定性。
最终的回归模型包括两个部分,一是估计自变量对因变量的影响,二是估计自变量对因变量方差的影响。
5.2 模型分析
为了验证上述结论,本研究将在已有研究基础上进一步研究不同程度、不同知识来源的专利新近性与时域性对专利影响力不确定性的影响,即专利影响力的离散程度。同时,还将研究不同知识来源的时域性、新近性对专利影响力不确定性的影响是否相同。
为了衡量目标专利所吸收知识的新近性与时域性的程度,并进一步对比吸收不同程度新近性与时域性的专利,本研究定义了不同的新近性与时域性的二元变量(如表4所示),在专利知识新近性方面,将吸收知识新近性前5%的专利定义为高度新近性,前5%至前20%的专利定义为中度新近性,而其余的专利定义为低新近性。而在专利知识时域性方面,相似地,将吸收知识时域性位于前5%的专利定义为高度时域性,前5%至前20%的专利定义为中度时域性,其余的专利定义为低时域性。表4中具体描述了不同新近性与时域性类别的专利的占比。
基于Wang等[18]以及Lee[16]对知识新颖性对科学创新与技术创新风险影响的研究,本研究采用负二项分散模型估计专利吸收的科学与技术知识的新近性与时域性对专利影响力离散程度的影响程度,以此体现其对于专利创新不确定性的影响。为了拟合负二项分散模型,采用Stata函数gngreg进行回归。
本研究将目标专利在发表后五年时间窗口内的被引次数作为专利创新的影响力,并控制了其他可能影响专利影响力与知识新近性和时域性之间关系的因素。首先,控制了目标专利的发表时间,不同时间段所对应的社会环境可能对专利的被引次数产生较大的影响。其次,控制了专利的发明人类型,不同的发明人类型可能导致专利的公开或者关注度不同,进而影响专利的影响力;最后,控制了目标专利所引用的科学与技术领域的广度与深度。
表4 不同类型专利占比
表5 负二项分散模型验证结果
为了验证专利吸收知识的时间属性对专利影响力离散程度的影响,建立了三个GNB模型。模型1作为基准模型,只包含了相关的控制变量;模型2在模型1的基础上加入了二元变量SciRecenty Low、TechRecenty Low、SciSpread Low以及TechSpread Low,用于表示低时域、非新近的专利;模型3在模型1的基础上加入了二元变量SciRecenty High、TechRecenty High、SciSpread High、TechSpread High、SciRecenty Medium、TechRecenty Medium、SciSpread Medium与TechSpread Medium,用于验证吸收不同新近与时域程度的科学/技术知识对专利影响力的离散程度的影响。根据公式(12),负二项分散模型回归模型要求预测变量的方差与均值之比和均值本身呈现线性关系[33]。基于Lee[16]的研究方法,本研究将三个模型对于预测变量专利影响力的预测值与回归残差的平方与预测值之比进行回归分析,验证了负二项分散模型在本研究的适用性。表5报告了上述回归结果,其中回归系数与截距项均显著,支持了模型的适用性。
而表6报告了负二项分散模型的结果。每个模型包含两个部分,分别为针对专利影响力均值的估计,以及针对影响力离散程度的估计。通过对比三个针对离散程度的模型,可以发现,在科学知识新近性方面,吸收高度新近的科学知识(SciRecenty High,β=0.053,p<0.005)的专利影响力离散度增加了5.44%(e0.053-1),吸收了中度新近的科学知识(SciRecenty Medium,β=0.077,p<0.005)的专利影响力离散度增加了8.00%(e0.077-1),均显著增加了专利影响力的离散程度。而低新近的科学知识(SciRecenty Low,β=-0.065,p<0.005)的专利影响力的离散度则降低了6.3%(e-0.065-1)。在科学知识时域性方面, 高时域性的科学知识(SciSpread High,β=-0.060,p<0.005)会显著降低专利影响力的离散程度,其专利影响力离散程度降低了5.8%(e-0.060-1) ,而中度时域性的科学知识对于专利影响力的离散程度并不显著。而低时域的科学知识(SciSpread Low,β=0.089,p<0.005)则会显著增加专利研发成果的离散程度,其专利影响力离散程度增加了9.3%(e0.089-1)。
在技术知识新近性方面,高度新近的技术知识(TechRecenty High,β=0.096,p<0.005)、中度新近的技术知识(TechRecenty Medium,β=0.022,p<0.005)会显著增加专利影响力的离散程度,而低新近性的技术知识(TechRecenty Low ,β=-0.035,p<0.005)会显著降低专利影响力的离散程度。其中,高度新近的技术知识的专利影响力离散程度增加了10.0%(e0.096-1),中度新近的技术知识的专利影响力离散程度增加了2.2%(e0.022-1),而低新近的技术知识(TechRecency Low, β=-0 .035,p<0.005)的专利影响力则降低了3.4%(e-0.035-1) 。在技术知识时域性方面,高度时域的技术知识(TechSpread High,β=0.120,p<0.005)与中度时域的技术知识(TechSpread Medium,β=0.052,p<0.005)均导致专利影响力的离散程度显著增加,其专利影响力离散程度分别增加了12.7%(e0.120-1)与5.3%(e0.052-1);而低时域的技术知识(TechSpread Low,β=-0.082,p<0.005)的专利影响力则降低了7.9%(e-0.082-1)。
根据上述模型验证发现,对于专利所吸收的科学知识而言,吸收高度与中度新近的科学知识都会导致专利影响力的不确定性显著增加,但是吸收高度时域性的科学知识则会降低专利影响力的不确定性 ,而吸收低科学时域知识的专利影响力的不确定性则会增大,这一定程度上解释了图 5中1979年以来专利吸收科学知识的时域性逐年上升的原因。而对于技术知识而言,吸收高度新近、中度新近以及高度时域、中度时域的技术知识都会增大专利影响力的离散程度,进而增加创新的不确定性,且技术知识新近性、时域性程度越高,专利影响力的不确定性增加越大。
结论与讨论
为了探究专利创新活动中所利用的来自科学与技术的不同时间属性知识的影响,本研究基于1979年至2013年间同时引用了专利与论文的2,563,948个目标专利,6,693,213个引用专利以及3,978,556篇引用论文的数据集,从宏观分布与微观机制研究了专利吸收的技术知识、科学知识的新近性与时域性。在宏观分布角度,分析了专利所吸收的技术知识、科学知识的新近性与时域性的时间变化情况,以及具体领域分布与专利申请人类型分布。在微观机制角度,从专利影响力的不确定性着手,探究了不同程度的新近性与时域性的科学和技术知识影响专利创新的风险,以及不同来源的知识在这一机制中的区别。从利用知识的新旧层面,本研究发现,无论是科学知识还是技术知识,在创新中利用过于新近的成果都会增加专利影响力的不确定性,使创新成果走向两极分化;但是在利用知识的时间跨度方面,科学知识与技术知识的影响存在显著的区别,利用时间跨度大的技术成果会带来更大的不确定性,而利用时间跨度大的科学知识则会降低专利影响力的不确定性。
从宏观来看,对总体趋势的分析表明,1979—2013年间专利所吸收科学与技术知识的新近性出现了先上升后回落的趋势,而专利所吸收的科学知识的时域性则出现了明显的上升趋势,技术知识的时域性也有小幅度上升。而在专利所属技术领域的分析表明,不同领域的专利所利用的科学与技术知识的新近性、时域性程度有着明显的区别。在技术知识的新近性方面,电子工程领域吸收了最新近的技术知识,说明该领域专利更偏向于利用新的技术知识,技术创新活跃,而机械工程领域技术新近性相对较低,说明其对于新技术的利用相对保守;而在科学知识的新近性方面,同样是电子工程领域吸收的科学知识最为新近,说明其科学-技术转化周期较短,而化学领域吸收的科学知识新近性最低,说明化学等偏向基础学科领域的科学-技术转化较慢。在知识时域性方面,电子工程领域同样是技术与科学时域性均较低,而化学领域所吸收科学知识的时域性较高。此外,仪器领域吸收的知识具有较高的科学时域性、较低的技术时域性;而机械工程领域则恰好相反。对于专利发明人的分析结果表明,同时承担了科研任务且利润压力较小的高等院校与政府及非营利机构利用了最新近的科学与技术知识,而企业与个人发明者对于新近知识的利用则相对保守。在利用知识的时域性方面,高等院校与政府及非营利组织的技术时域程度低于个人与企业,而科学知识的时域程度则高于企业发明者。
在微观层面,对于不同程度、不同来源的新近性与时域性的知识的效应分析结果表明,专利所吸收知识的时间属性会在不确定性层面影响专利创新的成果。专利创新中利用高度、中度新近的技术与科学知识与利用非新近的知识相比,会显著提高专利影响力的不确定性;利用高度、中度时域的技术知识同样会显著提高专利影响力的不确定性,但是利用高度时域的科学知识则会降低专利影响力的不确定性。专利影响力不确定性的大小,本质上揭示了专利创新的风险,不确定性越大,专利创新的成果越趋向于两极分化[16-17]。无论对于科学知识还是技术知识而言,高度新近的知识都会增大专利影响力的不确定性,这是因为更加新近的知识代表了学术界与工业界的更加新颖的研究成果。相较于新近性更低的知识,高新近性的知识可能代表着未来的突破式发展方向,但也可能在真实环境的检验中出现严重的失败,因此会增加专利影响力的不确定性[16]。而在时域性方面,吸收高时域性的科学知识会降低专利影响力的不确定性,与之相反,吸收高时域性的技术知识会增加专利影响力的不确定性。这一现象一方面是因为科学-技术的转化周期相对较长[4,25],利用长周期的科学知识可以更加全面地利用已有的科学研究,提高专利创新的成功率,进而降低专利影响力的不确定性;另一方面是因为技术知识的更新迭代更加迅速,过度借鉴以往的知识,可能会从早期的专利中借鉴成功因素,但是也可能因为无法适应当前的环境而增大失败的可能[9],从而增加专利影响力的不确定性。在专利的创新活动中,创新的结果可能是高度不确定且难以预测的[16]。上述发现解释了专利吸收知识的时间属性如何影响专利影响力的不确定性,并为已有的科技创新与技术创新成果的利用选择提供了一定的指引。如果发明人希望专利创新成果可以获得突破性的影响力,同时可以承担失败的风险,那么应该借鉴更加新近的技术发明与科学论文,同时对于长时间跨度内的技术发明进行广泛搜索与利用;如果发明人希望创新成果的影响力更加可控,且对于风险的承受能力较低,那么则应该避免利用最新近的技术发明与科学论文,同时更加广泛地回溯与利用长时间跨度内的科学论文。
本研究在现有研究的基础上进一步扩展,从不同时间维度、不同知识来源的角度分析了专利创新活动中利用知识的现状,并进一步探究了其对于专利影响力的不确定性的影响。但是本研究仍然存在着不足,例如本研究中对于专利影响力的测度使用了专利被引次数,但是专利被引次数无法完全代表专利的影响力,有些专利引用行为只是为了限制权利要求或者是由审查人员添加的,而并未实际引用专利的技术内容,这种引用行为难以判断其真正动机[34]。此外,专利被引次数也无法从专利的内容维度进行专利影响力的衡量。在本研究的测度体系中,目标论文的引用专利数与引用论文数的不同也可能会对测度结果产生影响,例如引用专利数与引用论文数越少,新近性与时域性的数值波动越明显。未来研究中将尝试采取机器学习等方法对专利利用知识的不同维度属性进行更细致的识别提取,并采用更加合理的测度指标,以进一步明确专利创新活动中不同知识属性的影响。
参考文献
作者简介
*原文载于《信息资源管理学报》2024年第4期,欢迎个人转发,公众号转载请联系后台。
* 引用格式
张佳锐,康乐乐,孙建军.科学与技术知识融合中的新近性与时域性作用研究[J].信息资源管理学报,2024,14(4):86-102.
往期 · 推荐
制版编辑 | 周凡倩
审核 | 于 媛
长按识别二维码关注我们
信息资源管理学报
分享、在看与点赞
只要你点,我们就是朋友😊