当期荐读 2024年第4期 | 高校高价值专利技术机会识别研究——以“生成式人工智能”领域为例

学术   2024-09-13 16:00   湖北  

图源 | Internet


冉从敬 李 旺 黄文俊

武汉大学信息管理学院,武汉,430072




摘 要 

提出一种高校高价值专利技术机会识别方法,使用主题建模、突变级数法、机器学习与离群值检测算法,在评估出高校高价值专利的基础上,进一步识别出具有潜在技术机会的技术主题与专利技术。以“生成式人工智能”领域为例进行实证,研究结果表明:“生成式人工智能”领域的潜在技术主题集中在深度学习、神经网络与机器学习等前沿领域,AI影像、AI诊疗等技术为该领域的潜在技术机会,且上述技术均有国家相关政策大力支撑。本研究方法突破了单一技术机会识别方法识别结果针对性不强、识别专利价值不大、识别结果形式较为单一等核心问题,相关识别结果可以为高校技术转移、技术研发与技术创新提供决策支撑。

关键词


高价值专利;专利价值评估;技术机会识别;突变级数法;离群值检测算法


引用格式

冉从敬,李旺,黄文俊.高校高价值专利技术机会识别研究——以“生成式人工智能”领域为例[J].信息资源管理学报,2024,14(4):103-116.




1

引言

  作为国家技术创新体系的重要力量,高校理应在技术研发生命周期不断缩短的背景下及时准确捕捉和辨识技术机会,精准配置研发投入,从而转技术机会为技术优势,助力国家部署与占领科技制高点。然而,积年形成的庞大专利池既是技术机会的重要来源,却也因较高的筛选难度而拖慢了技术机会涌现的步伐。与创新驱动发展战略进程、知识产权强国建设进程同步,我国专利申请量、授权量连年快速增长,仅2022年,国家知识产权局受理专利申请便超过536万件,创历史新高。而与之形成对比的是,2022年我国高校发明专利产业化率、许可率、实施率仅为3.9%、7.9%、16.9%,远低于整体水平的36.7%、12.1%、48%。除却少量不宜直接转移转化的基础性创新成果及战略性闲置专利,高校申请的大量专利缺乏商业化前景,专利成果与市场需求“两张皮”的现象比较突出[1],从原始专利池中直接进行技术机会识别无异于大海捞针。

  针对上述困境,除进一步压缩专利泡沫、促升专利质量外,开发智能化专利价值评估工具以筛选技术水平高、法律状态稳定、经济效益高的高校高价值专利正当其时,基于所确定的高校高价值专利进一步识别其中潜在技术机会则符合时需,将支撑高校专利在技术创新的起点环节占据主动权,助力搭建高校科学研究与核心技术攻坚、社会生产实践的转移转化桥梁。




2

相关研究

国内外学者针对高校高价值专利筛选与技术机会识别的研究已有较大进展,为高校技术转移、技术研发与技术创新实践提供了决策参考,也为本研究奠定了理论和方法基础。

2.1 高价值专利与技术机会相关概念

随着科技的不断发展和创新,专利作为保护技术创新成果的重要工具,其重要性日益凸显。在众多专利中,高价值专利因其独特优势而备受关注。当前学界尚未形成对高价值专利定义与内涵的统一界定,只是从不同角度表征高价值专利的特征。从专利价值评估角度来看,Blind等[2]与Hall等[3]认为某专利被引用的次数越多,其价值越高。从影响因素角度来看,Harhoff等[4]认为在专利维护费用高的环境中,专利的续期率越高,专利价值越高;Allison等[5]指出经历过诉讼的专利具有较高的价值。伴随“十四五”规划我国正式提出“保护和激励高价值专利”[6],高价值专利的挖掘、评估与识别逐渐成为研究热点。基于此,本研究借鉴当前主流高价值专利评估思路,从技术多样化角度出发,并结合“十四五”规划所界定“每万人口高价值发明专利拥有量”中对高价值发明的明确要求[6],将技术水平高、法律状态稳定、经济效益高且存在转移次数的专利定义为高价值专利,由此完成后续研究。

  技术机会这一概念早在上世纪90年代初由佐治亚理工学院科技政策与评估中心的Porter教授团队提出[7],他们认为技术机会本质上是一种新兴的技术情报,其监测需兼顾创新过程的“上游”和“下游”,即研究环节中的技术变化和市场环节中影响技术交付的相关社会经济背景因素的变化。Klevorick等[8]认为技术机会是指总体或某一特定领域的技术进步潜力。Olsson[9]进一步研究指出,技术机会的创造和利用需要渐进式创新、激进式创新及偶然发现的相互作用。在国内研究中,技术机会在宏观上多指某技术领域中具有发展前景的技术形态和技术发展点[10],是技术进步在技术上的可能性与经济上的可能性的统一[11],在微观上既包括科学进步推动的技术,又包括现有技术的组合和递进[12],多表现为技术新生、技术融合、技术突破三种形态[13]。可见,高价值专利与技术机会对技术经济效益、技术水平的要求是一脉相承的,具有相似性,同时,二者分别强调技术主题的当下价值与发展潜力,具有互补性,其结合将同时彰显技术主题价值性和前沿性。

2.2 高价值专利评估与技术机会识别

在专利数量快速增长及专利赋能经济社会高质量发展背景下,面对量化评估专利价值、筛选高价值专利的迫切需求,国内外学者广泛关注高价值专利评估方法的研发及优化,以综合评估方法、文献计量学方法、机器学习技术三类为主要方向进行持续创新。综合评估方法是专家主观评价与专利客观数据的结合,如Wang等[14]运用德尔菲法、层次分析法等采纳专家智慧完成指标选取、权重计算及专利分级;刘嘉龙等[15]运用熵值法通过指标计算识别出领域高价值专利。伴随知识产权信息化水平的提升,专利数据库提供了更为精确的专利引用数据,文献计量学方法被逐渐应用到高价值专利评估中。Yang等[16]基于关系代数对直接引用、间接引用、耦合和共被引四类专利引文网络进行组合,提出一种专利价值评估的方法。近年来,机器学习处理海量数据的效能优势不断凸显,机器学习算法被逐渐应用到高价值专利评估研究中。Trappey等[17]使用主成分分析确定专利质量关键影响因子,并将其输入BP神经网络模型提取高质量专利。此外,神经网络[18]、随机森林[19]、决策树[20]等也在不同侧面展现出应用于高价值专利评估的性能优势。

  高价值专利评估是对专利现实表征的综合评估,而技术机会识别是对空缺技术、融合技术、新兴技术等发展潜力的预测识别,相关研究呈现出由定性识别向定量识别过渡的趋势。早期技术机会识别以专家判断为中心,不断优化辅助专家决策的工具和流程。如Lee等[21]开发了基于关键词映射的专利地图以检测专利空缺,专家则负责其中关键词选择、专利空缺确定。总体而言,早期定性识别研究十分依赖专家判断,存在效率低、成本高、难复现等局限,在专利数量急剧增长、专利技术领域趋于复杂的现实背景下应用受阻,新近研究围绕结构化数据与非结构化数据的量化处理、组合进行创新,逐渐削弱定性识别的比重。如Kim等[22]使用专利文本数据和专利引用网络测算专利集群间的连接度,用以识别具有高度技术融合潜力的技术机会。

  因此,基于上述对高价值专利评估与技术机会识别的探索,本研究拟在现有高价值专利技术机会识别研究基础上提出两点改进:其一,在研究对象层面,主要面向高校专利进行高价值专利评估及后续技术机会识别。相比企业专利以获得市场竞争优势、促进产业发展为目的,高校专利多以推动科技创新、学术研究、人才培育和社会发展为目标导向,往往代表着国内相关领域的顶尖研究水平。然而,当前较低的高校发明专利转移转化率表明大量科技资源闲置浪费严重,高校科技成果“沉睡”,企业转化需求“饥渴”,高校科技成果面临“重赏之下无勇夫,成果转化难见效”的尴尬局面,筛选高校高价值专利并对其进行技术机会识别迫在眉睫。其二,在研究方法层面,一方面,引入指标评估与机器学习相结合的混合方法进行专利价值评估并对高价值专利进行技术机会识别,不仅可以弥补单一价值评估方法评估精度不足的问题,还能突破原有技术机会识别方法识别结果针对性不强、识别专利价值不大、识别结果形式较为单一等核心问题。另一方面,综合高价值专利评估和技术机会识别两种研究范式的优势,发挥高校高价值专利所具有的前瞻性与引领性,从专利评估所得高校高价值专利群中识别出具有潜在技术机会的技术主题与专利技术,进而提升技术机会识别的科学性与合理性。



3

研究设计

遵循“专利数据采集与主题建模→评估指标构建与高价值专利筛选→高价值专利技术机会识别”的逻辑主线,综合突变级数法、AutoGluon机器学习框架与LOF算法等研究方法,本研究构建了如图1所示的高校高价值专利技术机会识别模型。

图1 高校高价值专利技术机会识别模型

3.1 专利数据采集与处理

信息技术革命带动的新技术发展浪潮蓬勃兴起并加速深化,人工智能技术是其中关键组成部分。2022年,被认为是生成式人工智能的聊天机器人ChatGPT一经推出便席卷全球,人工智能技术再次成为全球技术焦点[23];《2023年十大新兴技术报告》中指出,生成式人工智能是一种通过学习大规模数据集生成新的原创内容的新型人工智能,其将在教育和研究等多个行业引发颠覆性变革[24]。作为新一批推动社会变革与经济增长的技术引擎,生成式人工智能领域潜在的技术趋势和方向识别具有极高的重要性。因此,本研究以“生成式人工智能”这一技术领域为例,验证高校高价值专利技术机会识别模型的有效性。

  由于生成式人工智能技术具有知识多样性和技术复杂性,很难通过单个国际专利分类号或者IPC组合对其进行界定,故本研究在专利检索时将“生成式人工智能”划分为“自然语言处理”“深度学习”“机器学习”“生成式预训练”四个技术单体,同时采用关键词和IPC分类号相结合的检索方式。关键词确定主要通过专家访谈、文献检索、产业资料收集等方式实现[25-26],IPC分类号主要参考2018年发布的《国际专利分类与国民经济行业分类参照关系表》及相关文献等[27-28]。生成式人工智能专利检索策略如表1所示。

  基于上述检索策略,本研究选取“生成式人工智能”领域作为实证对象,数据来源为Incopat专利数据库,专利类型为中国发明授权专利和实用新型专利,分别对申请人为“大学”和“公司”且专利法律状态为“有效”的专利进行检索,检索时间为2023年10月1日,共检索到大学专利25,757件,公司专利22,786件,而后提取大学与公司单独申请的、转让次数为“0”的专利数据,再对数据集进行同族去重与独立权利要求、申请人等标签抽取操作,最终获取22,269件大学专利数据集形成本次实验的实验数据集,19,320件公司专利数据集形成本次实验的模型训练数据集。

表1 “生成式人工智能”专利检索策略

3.2 主题建模

在专利文本中,专利独立权利要求是专利技术功效的高度概括,对独立权利要求文本进行挖掘分析能构建更为优质的实验数据。基于此,本研究整合多个专利数据库的关键词提取工具形成专业领域词典,并提取实验数据集中独立权利要求文本,运用Python中jieba库进行分词、去停用词操作,形成“专利-关键词”数据矩阵,并采用词袋模型(BOW)与TF-IDF算法对“专利-关键词”数据矩阵的文本进行特征表示与向量化操作,从而形成主题建模语料库。

  在主题建模的过程中,技术主题选取数量在一定程度上影响分析结果的科学性,本研究引入困惑度计算方式对技术主题选取数量进行修正。困惑度由Blei等[29]提出,主要用于评估语言模型的优劣程度,一般情况下,困惑度处于最低点或拐点处时对应最佳主题数量,其计算公式如下:

      基于困惑度计算方式,将向量化的专利独立权利要求进行LDA主题建模,并结合困惑度计算结果选取最佳主题数量,形成“主题-关键词”矩阵。

3.3 专利价值评估指标构建

专利价值评估指标选取是模型评估的重要环节,其合理性直接影响评估精度与信度。2023年9月1日起,国家知识产权局等组织编制的推荐性国家标准《专利评估指引》(国家标准编号GB/T42748-2023,以下简称《指引》)实施[30]。在前期开展试点和广泛征求意见的基础上,《指引》构建了一套可扩展、可操作的专利价值分析评估指标体系,包括一级指标3项,二级指标14项,三级指标27项及扩展指标若干项,以促成专利的市场定价和价值实现[31]。结合《指引》指标确定规则及数据可量化研究范式,本研究以《指引》中18项定量核心指标为基准,结合当前专利数据库数据指标可得性构建了包含法律价值、技术价值、经济价值三个维度,14项指标的专利价值评估指标体系。专利价值评估指标具体解释如表2所示。

表2 专利价值评估指标汇总

3.4 高价值专利评估

(1)基于突变级数法的专利价值评估

  突变级数法是一种以多层次评价指标为基础的综合评价方法,结合突变理论与模糊数学导出突变模糊隶属函数,对评价目标进行逐级归一运算,从而对评价目标进行排序分析[40]。常见的突变系统模型如表3所示。

      其中,F(x)表示一个系统的状态变量X的势函数,A、B、C、D表示该状态变量的控制变量。四个控制变量的重要性排序为A>B>C>D,可以依据熵权法计算的权重确定控制变量的排序。同时,依据突变级数法的取值原则,控制变量必须取0—1区间的值,所以首先对专利指标数据进行标准化处理。在计算过程中,使用熵值法对指标赋权,而后运用突变级数法对高校专利进行价值评估,实现评估精度的提升。

  (2)基于AutoGluon机器学习框架的专利价值评估

  AutoGluon是一个开源的Python库,可自动化机器学习过程,帮助用户获取高精度结果。在本步骤中,调用AutoGluon表格预测功能,通过fit函数在标准监督学习任务中实现高精度预测,省去了数据清理、超参数优化、模型选择等繁琐过程,从而大幅度提升研究效率[41]

  (3)基于混合方法的高校高价值专利评估

  突变级数法是一种客观赋值法,以指标的相对重要程度排序代替直接赋权,受人为主观性影响较小,评估结果科学性、准确性高。而Autogluon机器学习框架融合多种技术特点,可从多维度、多视角对专利进行评估,实现方法智能高效,评估结果相对精准。本研究同时利用突变级数法与AutoGluon机器学习框架对高校专利进行价值评估,取二者评估结果之交集构成高校高价值专利数据集。

表3 突变系统模型

3.5 高价值专利技术机会识别

(1)高价值专利数据集Doc2vec文本建模

  2014年,Mikolov等提出了段落向量化的深度学习模型Doc2vec,该模型不仅加入文本语义信息,同时具有更好的泛化能力,在学术研究的文本向量化表示得到广泛的验证和应用[42]。基于此,本研究选用Doc2vec模型对高校高价值专利独立权利要求语料库进行向量化表示。

  (2)高价值专利技术机会识别

  在对专利摘要进行向量化表示后,应用离群点检测技术LOF算法识别离群专利。具体地,LOF算法首先使用k-近邻算法来确定每个数据点的k个最近邻居,然后计算每个点的局部可达密度(LRD),即该点与其k个最近邻居的距离的倒数的平均值的倒数。接着,计算每个点的LOF值,即该点的LRD与其k个最近邻居的LRD的比值的平均值。LOF值越大,表示该点越可能是异常点。计算过程如下:

  ①局部可达密度计算

  ②局部离群因子计算

  在专利分析中,使用LOF算法可以对专利进行异常检测,具有高局部离群因子的专利往往代表着当前技术趋势之外的新兴技术领域,可能具有重要的商业和创新价值[43-45]。因此,本研究使用LOF算法来对高校高价值专利数据集进行技术机会识别,从而挖掘出高校高价值专利的技术主题与潜在技术机会,为高校技术转移、技术研发与技术创新提供决策支撑。



4

研究结果

4.1 “生成式人工智能”领域专利主题建模结果

提取大学独立申请的专利实验数据集,基于困惑度计算方式,将主题范围设置为1—50,迭代次数为100次,在不同主题数下计算LDA主题模型的困惑度,困惑度计算结果如图2所示。

图2 主题困惑度曲线与一致性曲线

分析图2可知,当主题数为9时,困惑度较低且一致性指数较高,所以将LDA主题提取数量设置为9,下位主题词设置为10,迭代次数为100。在获取最优主题模型后,LDA模型运算结果会输出每个技术主题下的相关技术语义词以及“专利-主题”概率矩阵,概率矩阵中支持度表征专利与相应主题的关联度,最终获取高校“生成式人工智能”领域专利所属技术主题,对技术主题及其关键词进行同类合并,同时对主题进行概括,最终获取高校专利主题分布,详见表4。

据主题聚类结果可知,当前高校“生成式人工智能”领域专利可大致分为九大主题,主要聚焦于自然语言处理、深度学习、图像处理、人工智能等关键技术,其中技术主题属Top9的专利最多,高达16,465件,该主题即为当前高校“生成式人工智能”领域的研究热点,激烈的研发竞争会促使领域技术飞速发展,也大大提高了技术机会产生的概率;而技术主题属Top2的专利最少,研究活跃度较低。然而,较低的研究活跃度也可能伴随着技术机会的诞生,因为这可能意味着该主题尚未被充分发掘或研究,因而存在更多的创新空间和可能性。

表4 主题聚类

4.2 高价值专利评估结果

  提取大学独立申请的专利实验数据集,结合前文构建的指标体系,运用突变级数法对高校专利进行价值评估。首先借助熵值法获取二级指标权重,而后将各维度二级指标相加获取一级指标权重,同时根据指标数量确定各个评估维度的突变系统类型,结果见表5。

  确定指标权重与突变类型后,对指标运用突变级数法进行运算,从而得出实验数据集中的专利价值,并对其进行正态验证。由于数据样本数量多于50,故使用K-S检验,输出结果显示得分呈现出显著性(<0.05),意味着拒绝数据正态分布的原假设,呈现偏态分布趋势,数据无法体现典型值且偏态数据影响均值的典型值,故使用得分中位数0.79作为筛选阈值,最终筛选出11,133件高校高价值专利。

表5 专利价值评估指标权重与突变系统类型

接下来,将公司独立申请的专利模型训练数据集喂入模型进行训练,其中存在权利专利的专利标签为“1”,不存在权利转移的专利标签为“0”,并根据2∶8原则划分专利数据训练集与专利数据验证集,从而完成模型训练。在多个模型集成训练后其最终“accuracy”为0.972,“mcc”为0.956,“”为0.893,“precision”为0.967,可见模型预测结果较好,可用于专利价值预测,模型效果如表6所示。

表6 所有预训练模型在测试集的效能

      最后,将实验数据集(22,269件)导入训练好的模型中进行预测,最终获得368件高校高价值专利。综合上述实验,通过突变级数法与AutoGluon机器学习框架分别获取了“生成式人工智能”领域高校高价值专利11,133件、368件,取交集后得到“生成式人工智能”领域高校高价值专利238件,至此完成高价值专利评估过程,形成“技术机会识别”数据集。

4.3 高价值专利技术机会识别结果

  提取“技术机会识别”数据集,对数据集中的独立权利要求文本进行分词和去停用词处理,生成实验语料集。而后,在Python中导入gensim库,并使用Doc2vec模型对专利独立权利要求文本进行向量化表示。根据本研究数据体量与以往研究经验[46-48],对Doc2vec设置模型为DBOW,其中window设定为4,文本向量维度选择为40,即每个专利独立权利要求文本被表示为40维向量,词最小出现次数为2,同时epochs设定为30以提升计算准确度。

  “技术机会识别”数据集在经过Doc2vec模型向量化训练后,形成238×40的文本向量矩阵,并引入Python的sklearn库,选用LOF算法对专利进行技术机会识别。基于本研究实证领域与数据体量,为了实现从更加微观的角度对高价值专利进行细粒度评估,将参数k设置为2,求得LOF计算结果,将测度阈值设置为1,用以获取“技术机会识别”数据集中的离群专利。当某件专利的LOF值远大于1时,则该专利的分布偏于稀疏,可视为离群专利。通过测算,本研究在238件高价值专利中获取了3件离群专利,这3件离群专利分别属于Top9与Top2,结果如表7所示。

表7 “生成式人工智能”领域潜在技术机会

  为验证方法有效性,本研究从优势技术领域政策导向性与技术机会市场导向性两个维度,验证研究所得潜在技术领域与潜在技术机会的科学性。

  本研究所得优势技术领域即优势主题为Top2与Top9,结合主题聚类情况(表4),Top2主题所关联关键词均属于深度学习、神经网络模型,Top9主题所关联关键词均为机器学习关键基础,因而,本研究所得优势技术领域主要聚焦“生成式人工智能”领域的机器学习、深度学习与神经网络等关键技术。与之对应的是,2015年5月,国务院印发规划周期为10年的《中国制造2025》,要求“积极推动量子计算、神经网络等发展”[49];2015年8月,国务院印发规划周期为5—10年的《促进大数据发展行动纲要》,将“支持自然语言理解、机器学习、深度学习等人工智能技术创新,提升数据分析处理能力、知识发现能力和辅助决策能力”列为主要任务[50];2021年12月,国务院印发规划周期为5年的《“十四五”数字经济发展规划》,部署将机器学习技术应用到农林牧渔业生产中[51]。上述机器学习、深度学习与神经网络相关战略部署正处于纵深发力期,同本研究所得优势技术领域契合度较高。

  本研究所识别出的技术机会分别将(生成式)人工智能技术应用于现代医学中CT影像分类、视网膜血管图像分类及中华民族传统医学相关医学古汉语句子切分,可进一步辅助临床诊断及医学研究,均与AI医疗有一定关联。2023年6月,前文所提世界经济论坛公布的《2023年十大新兴技术报告》所揭示的在未来三到五年内将对世界产生深远影响的新兴技术中,生成式人工智能、人工智能辅助医疗同时在列[34]。当前,以大语言模型为代表的生成式人工智能发展如火如荼,而人工智能在医疗领域的应用尚处发展初期,对比发展较早、规制相对成熟的发达国家和地区,我国AI医疗还面临法律规章尚属空白、专业人才缺口较大、数据安全风险伴生及商业模式有待建立等多层面挑战[52]。与此同时,自2018年开始,我国人工智能医疗行业监管政策逐步完善,个别赛道开始出现可行性强的商业模式;2021年7月,国家药监局发布《人工智能医用软件产品分类界定指导原则》,明确人工智能医用软件产品按照第三类医疗器械管理[53];2021年12月,《“十四五”生物经济发展规划》出台,明确部署利用云计算、大数据、人工智能等信息技术支撑新药研制、辅助诊疗、发展高端医学影像等诊断装备[54];2023年7月,国家卫健委等六个部门联合发布《深化医药卫生体制改革2023年下半年重点工作任务》,要求推进“5G+医疗健康”、医学人工智能、“区块链+卫生健康”试点工作[55]。由此可见,AI影像、AI诊疗等智慧医疗技术发展迎来风口,该赛道众多相关企业如阿里巴巴、腾讯、百度、科大讯飞、依图、京东、华大基因等正积极探索商业模式,而本研究所识别出的专利均属于AI影像、AI诊疗等技术模块,一定程度上印证了技术机会识别方法的科学性与合理性。

  与此同时,为进一步探讨本方法的科学性,本研究选取国内被引次数较多的技术机会识别方法作指标体系、识别方法、识别结果多维对比如表8所示。

  对比分析可知,在指标体系方面,当前主流研究多依据国家知识产权局早前编制的《专利价值分析指标体系操作手册》及相关研究观点进行指标体系构建,本研究所采用的指标体系则是依据最新实施的,由国家知识产权局、中国人民银行、国家金融监督管理总局编制的推荐性国家标准《专利评估指引》构建而成,每项指标均依据政策说明形成量化指标,所使用的量化指标均在前人研究成果中有所体现,使得该指标体系的科学性、合理性与适用性得到进一步提升。在识别方法层面,本研究综合采用主题建模、突变级数法、机器学习、离群值检测算法等多种研究方法,以此提升技术机会识别效率及效果。在识别结果方面,当前技术机会识别相关研究多从海量专利中直接识别出技术机会专利,较少从主题层面考虑技术机会的发展态势,虽也有少数研究考虑了主题因素,但是由于研究方法原因导致识别的主题较多,识别的技术机会也较多,识别结果针对性不强。本研究则从高价值专利识别入手,从中识别了技术机会,并进一步考量了技术机会所属主题,对技术主题与技术机会都进行了详细论述,技术机会识别结果得以多样化,识别结果的参考意义得以提升。

  综上所述,据本研究提出的高校高价值专利技术机会识别方法,当前“生成式人工智能”领域核心专利技术主要集中于深度学习、机器学习与神经网络等关键技术领域,相关技术机会则为AI影像、AI诊疗等技术模块,上述实证结果的准确性经由国内外相关政策验证,并与其他相关研究进行了对比分析,表明本研究所提出的技术机会识别方法具有一定现实意义,可以为高校技术转移、技术研发与技术创新提供决策支撑。

表8 研究方法对比分析



5

结语

遵循“专利数据采集与主题建模→评估指标构建与高价值专利筛选→高价值专利技术机会识别”的逻辑流程,本研究构建了高校高价值专利技术机会识别模型,在识别出高校高价值专利的基础上,能够及时有效地挖掘出其中的技术机会,从而为高校技术转移、技术研发与技术创新提供参考。在研究的过程中,依托LDA模型、困惑度计算、突变级数法、AutoGluon机器学习框架、Doc2vec文本建模与LOF算法,实现了从高校高价值专利识别到潜在技术主题识别再到潜在技术机会识别的规范化流程,在一定程度上为高校提供了一种可实践的技术创新参考方向,助力其把握技术机会,占领技术研发高地。

  本研究的主要贡献:①体系构建。本研究基于最新权威政策与研究文献,构建了一套较为规范的专利价值评估体系,并将其运用在技术机会识别中,取得了较好的研究结果。②方法创新。本文所提出的技术机会识别方法在筛选出领域内高价值专利的基础上进行技术机会识别,弥补了单一技术机会识别方法识别结果针对性不强、识别专利价值不大、识别结果形式较为单一等不足之处。③实证贡献。本研究将“生成式人工智能”领域作为实证对象,结果表明,该领域的潜在技术主题集中于深度学习、神经网络、机器学习等,潜在技术机会为AI影像、AI诊疗等,上述研究结果均有大量权威政策背书,对该领域技术创新有一定参考价值。

  当然,本研究提出的高校高价值专利技术机会识别模型仍存在着一些不足,在实证领域选取方面,本研究仅选择了“生成式人工智能”领域技术作为实证对象,技术领域较为单一,普适性不强;在数据维度获取层面,本研究仅仅将专利作为分析数据来源,尚未将论文、软著等技术文献纳入数据来源范围,数据维度较为单一;在结果验证层面,本研究仅利用政策文件佐证技术发展趋势,尚未形成基于定量分析的结果验证方法。因此,构建全技术领域、多维度数据指标的识别模型,思考定量结果验证方法将会是未来的重点研究方向。



参考文献

[1] 张军荣,杨思捷,周璐.中国高校专利产权制度演化的内在逻辑与制度重构[J].科技进步与对策,2023,40(21):99-107.(Zhang J R,Yang S J,Zhou L.The internal logic and system reconstruction of the evolution of university patent system in China[J].Science & Technology Progress and Policy,2023,40(21):99-107.)

[2] Blind K,Cremers K,Mueller E.The influence of strategic patenting on companies' patent portfolios[J].Research Policy,2009,38(2):428-436.

[3] Hall B H,Jaffe A,Trajtenberg M.Market value and patent citations:A first look[J].Rand Journal of Economics,2005,36(1):16-38.

[4] Harhoff D,Narin F,Scherer F M,et al.Citation frequency and the value of patented inventions[J].Review of Economics and Statistics,1999,81(3):511-515.

[5] Allison J R,Lemley M A,Walker J H.Extreme value or trolls on top? The characteristics of the most litigated patents [J].University of Pennsylvania Law Review,2009,158(1):1-37.

[6] 中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要[EB/OL].[2023-10-08].https://www.gov.cn/xinwen/2021-03/13/content_5592681.htm.(Outline of the Fourteenth Five-Year Plan for the National Economic and Social Development of the People's Republic of China and the Vision 2035[EB/OL].[2023-10-08].https://www.gov.cn/xinwen/2021-03/13/content_5592681.htm.)

[7] Porter A L,Detampel M J.Technology opportunities analysis[J].Technological Forecasting and Social Change,1995,49(3):237-255.

[8] Klevorick A K,Levin R C,Nelson R R,et al.On the sources and significance of interindustry differences in technological opportunities[J].Research Policy,1995,24(2):185-205.

[9] Olsson O.Technological opportunity and growth[J].Journal of Economic Growth,2005,10(1):31-53.

[10]马婷婷,汪雪锋,朱东华,等.基于专利的技术机会分析方法研究[J].科学学研究,2014,32(3):334-342,383.(Ma T T,Wang X F,Zhu D H,et al.Research on technology opportunity analysis based on patents[J].Studies in Science of Science,2014,32(3):334-342,383.)

[11]李保明.技术机会与技术创新的决策[J].科学管理研究,1990,8(5):61-62.(Li B M.Technological opportunity and technological innovation decision-making[J].Scientific Management Research,1990,8(5):61-62.)

[12]苏娜平,谭宗颖.技术机会分析方法研究综述与展望[J].情报理论与实践,2020,43(11):179-186.(Su N P,Tan Z Y.Review and vision for the future of the research on technology opportunity analysis methods[J].Information Studies:Theory & Application,2020,43(11):179-186.)

[13]伊惠芳,刘细文,龙艺璇.技术创新全视角下技术机会发现研究进展[J].图书情报工作,2021,65(7):132-142.(Yi H F,Liu X W,Long Y X.A review of technology opportunity discovery from the full perspective of technology innovation[J].Library and Information Service,2021,65(7):132-142.)

[14]Wang B,Hsieh C H.Measuring the value of patents with fuzzy multiple criteria decision making:Insight into the practices of the Industrial Technology Research Institute[J].Technological Forecasting and Social Change,2015,92:263-275.

[15]刘嘉龙,丁晟春.产业领域前沿专利技术识别方法研究——以人工智能领域为例[J].信息资源管理学报,2021,11(6):95-104,115.(Liu J L,Ding S C.Research on the identification method of cutting-edge patented technology in the industrial field:Taking the field of artificial intelligence as an example[J].Journal of Information Resources Management,2021,11(6):95-104,115.)

[16]Yang G C,Li G,Li C Y,et al.Using the comprehensive patent citation network (CPC) to evaluate patent value[J].Scientometrics,2015,105(3):1319-1346.

[17]Trappey A J C,Trappey C V,Wu C Y,et al.A patent quality analysis for innovative technology and product development[J].Advanced Engineering Informatics,2012,26(1):26-34.

[18]Lee C Y,Kwon O,Kim M,et al.Early identification of emerging technologies:A machine learning approach using multiple patent indicators[J].Technological Forecasting and Social Change,2018,127:291-303.

[19]王思培,韩涛.基于随机森林算法的潜在高价值专利预测方法研究[J].情报科学,2020,38(5):120-125.(Wang S P,Han T.Prediction method of potential high-value patents based on random forest algorithm[J].Information Science,2020,38(5):120-125.)

[20]宋凯.高校专利技术转移价值评估研究——基于熵权TOPSIS模型和梯度提升树算法[J].情报杂志,2021,40(7):52-57.(Song K.Research on the technology transfer value evaluation of university patent based on entropy weight TOPSIS model and GBDT[J].Journal of Intelligence,2021,40(7):52-57.)

[21]Lee S,Yoon B,Park Y.An approach to discovering new technology opportunities:Keyword-based patent map approach[J].Technovation,2009,29(6/7):481-497.

[22]Kim B,Gazzola G,Lee J M,et al.Inter-cluster connectivity analysis for technology opportunity discovery[J].Sci-entometrics,2014,98(3):1811-1825.

[23]ChatGPT:Optimizing language models for dialogue[EB/OL].[2023-04-17].https://openai.com/blog/chatgpt.

[24]Top 10 emerging technologies of 2023[EB/OL].[2023-10-09].https://www.weforum.org/reports/top-10-emerging-technologies-of-2023/digest#report-nav.

[25]王浩伟,汪 ,王秉琰.主题视角下生成式人工智能生成内容与用户生成内容的比较[J].情报理论与实践,2023,46(10):200-207,199.(Wang H W,Wang F,Wang B Y.A comparison of generative AI-generated content and user-generated content in the thematic perspective[J].Information Studies:Theory & Application,2023,46(10):200-207,199.)

[26]齐亚双,张白洋,李淼,等.专利技术融合驱动的技术机会识别研究——以人工智能图像处理技术为例[J].现代情报,2023,43(8):150-160.(Qi Y S,Zhang B Y,Li M,et al.Research on the identification of technology opportunities driven by patent technology fusion: Taking image processing technology as an example[J].Journal of Modern Information,2023,43(8):150-160.)

[27]国际专利分类与国民经济行业分类参照关系表(2018)[EB/OL].[2023-10-08].https://www.gov.cn/zhengce/zhengceku/2018-12/31/5443898/files/74249b84a762440fbe0fa195a3c14e93.pdf.(Table of reference relationships between the international patent classification and the national economic sector classification(2018)[EB/OL].[2023-10-08].https://www.gov.cn/zhengce/zhengceku/2018-12/31/5443898/files/74249b84a762440fbe0fa195

 a3c14e93.pdf.)

[28]邓胜利,汪 ,王浩伟.在线社区中人工智能生成内容的识别方法研究[J].图书情报知识,2024,41(2):28-38.(Deng S L,Wang F,Wang H W.Identification methods of artificial intelligence generated content in online communities[J].Documentation,Information & Knowledge,2024,41(2):28-38.)

[29]Blei D M,Ng A Y,Jordan M I. Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,3(4-5):993-1022.

[30]国家标准公开系统.专利评估指引[EB/OL].[2023-09-27].https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=21AB9B32C8B01C3849AF785EBEFC357B.(National Standard Disclosure System.Patent valuation guidelines[EB/OL].[2023-09-27].https://openstd.samr.gov.cn/bzgk/gb/newGbInfo?hcno=21AB9B32C8B01C3849

 AF785EBEFC357B.)

[31]《专利评估指引》国家标准正式发布[EB/OL].[2023-09-27].https://mp.weixin.qq.com/s/SCJdRQyNVk2H6q

 YA5mPyjA.(National standard on Patent Valuation Guidelines officially released[EB/OL].[2023-09-27].https://mp.weixin.qq.com/s/SCJdRQyNVk2H6qYA5mPyjA.)

[32]冉从敬,李旺.校企合作视角下高校高价值专利推荐模型构建——以“新能源汽车”为例[J].图书情报工作,2023,67(11):115-126.(Ran C J,Li W.The construction of high-value patent recommendation model for universities from the perspective of university-enterprise cooperation:Taking "new energy vehicles" as the case[J].Library and Information Service,2023,67(11):115-126.)

[33]刘运华,刘兴华,李晶.建立有利于科技成果转化的专利质量评价体系研究[J].科学管理研究,2022,40(2):65-72.(Liu Y H,Liu X H,Li J.Research on patent quality analysis to promote the transformation of scientific and technological achievements[J].Scientific Management Research,2022,40(2):65-72.)

[34]文豪,胡晓阳.基于质量评价模型的专利质押价值评估体系修正研究[J].科技管理研究,2022,42(21):168-175.(Wen H,Hu X Y.Research on the modification of patent pledge evaluation system based on quality evaluation model[J].Science and Technology Management Research,2022,42(21):168-175.)

[35]宋凯,冉从敬.基于主题挖掘与专利评估的技术机会识别研究——以智慧农业为例[J].图书情报工作,2023,67(3):61-71.(Song K,Ran C J.Research on technology opportunity identification based on topic mining and patent evaluation:A case study of smart agriculture[J].Library and Information Service,2023,67(3):61-71.)

[36]刘澄,雷秋原,张楠,等.基于BP神经网络的专利价值评估方法及其应用研究[J].情报杂志,2021,40(12):195-202.(Liu C,Lei Q Y,Zhang N,et al.Research on patent value evaluation method based on BP neural network and its application[J].Journal of Intelligence,2021,40(12):195-202.)

[37]王舒,马新宇,彭博,等.高校高价值专利评估的理论探讨[J].中国高校科技,2020(S1):15-18.(Wang S,Ma X Y,Peng B,et al.Theoretical discussion on the evaluation of high-value patents in colleges and universities[J].Chinese University Science & Technology,2020(S1):15-18.)

[38]刘妍.专利价值评估研究综述与趋势展望[J].图书情报工作,2022,66(15):127-139.(Liu Y.Review and trend prospect of the research on patent value evaluation[J].Library and Information Service,2022,66(15):127-139.)

[39]Bakker J.The log-linear relation between patent citations and patent value[J].Scientometrics,2017,110(2):879-892.

[40]陈晓红,彭佳,吴小瑾.基于突变级数法的中小企业成长性评价模型研究[J].财经研究,2004,30(11):5-15.(Chen X H,Peng J,Wu X J.Appraisal model based on the sudden change progression for the growth of small and medium-sized enterprises[J].Journal of Finance and Economics,2004,30(11):5-15.)

[41]AutoGluon:AutoML for text,image,and tabular data[EB/OL].[2022-09-01].https://auto.gluon.ai/stable/index.html.

[42]Liu T L,Hsieh L H,Huang K C.Applying natural language processing and TRIZ evolutionary trends to patent recommendations for product design[J].Applied Sciences,2022,12(19):10105.

[43]李佳佳,马铁驹.利用局部离群因子算法探测核心技术发展趋势——以中国风能专利数据为例[J].情报杂志,2017,36(3):119-124,195.(Li J J,Ma T J.Detecting core technology's development trend with LOF: Based on wind energy patent data of China[J].Journal of Intelligence,2017,36(3):119-124,195.)

[44]宋凯,冉从敬.基于指标计算与内容分析的高校专利价值评估方法研究[J].情报理论与实践,2023,46(2):136-144.(Song K,Ran C J.Research on evaluation method of university patent value based on index calculation and content analysis[J].Information Studies:Theory & Application,2023,46(2):136-144.)

[45]杨辰,王楚涵,陶琬莹,等.基于专利的技术机会识别:深度学习领域的案例分析[J].科技管理研究,2021,41(12):172-176.(Yang C,Wang C H,Tao W Y,et al.Patent-based technology opportunity identification:A case study based on deep learning[J].Science and Technology Management Research,2021,41(12):172-176.)

[46]阮光册,夏磊.基于Doc2Vec的期刊论文热点选题识别[J].情报理论与实践,2019,42(4):107-111,106.(Ruan G C,Xia L.Hot topic detection in journal papers based on Doc2Vec[J].Information Studies:Theory & Application,2019,42(4):107-111,106.)

[47]刘怀兰,刘盛,周源,等.基于多源文本挖掘的技术演化路径识别[J].情报理论与实践,2022,45(11):178-187.(Liu H L,Liu S,Zhou Y,et al.Technology evolution path recognition based on multi-source text mining[J].Information Studies:Theory & Application,2022,45(11):178-187.)

[48]霍朝光,司湘云,王婉如.基于Doc2vec和SVM的作者姓名消歧研究——以PubMed Central为例[J].情报科学,2021,39(7):91-98,107.(Huo C G,Si X Y,Wang W R.Author name disambiguation based on Doc2vec and SVM: Taking PubMed central data as an example[J].Information Science,2021,39(7):91-98,107.)

[49]中国制造2025[EB/OL].[2023-11-06].https://www.gov.cn/zhuanti/2016/MadeinChina2025-plan/.(Made in China 2025[EB/OL].[2023-11-06].https://www.gov.cn/zhuanti/2016/MadeinChina2025-plan/.)

[50]国务院关于印发促进大数据发展行动纲要的通知[EB/OL].[2023-11-06].https://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.(Circular of the State Council on the issuance of the outline of action for promoting the development of big data[EB/OL].[2023-11-06].https://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.)

[51]国务院印发《“十四五”数字经济发展规划》[EB/OL].[2023-11-06].https://www.gov.cn/xinwen/2022-01/12/content_5667840.htm.(The State Council issued the "14th Five-Year Plan" for the development of the digital economy[EB/OL].[2023-11-06].https://www.gov.cn/xinwen/2022-01/12/content_5667840.htm.)

[52]韩晓光,朱小龙,姜宇桢,等.人工智能与机器人辅助医学发展研究[J].中国工程科学,2023,25(5):43-54.(Han X G,Zhu X L,Jiang Y Z,et al.Development strategies for artificial intelligence and robotics in medicine[J].Strategic Study of CAE,2023,25(5):43-54.)

[53]国家药监局关于发布人工智能医用软件产品分类界定指导原则的通告[EB/OL].[2023-10-08].https://www.beijing.gov.cn/zhengce/zhengcefagui/qtwj/202204/t20220408_2669468.html.(Circular of the State Drug Administration on the release of guiding principles for defining the classification of artificial intelligence medical software products[EB/OL].[2023-10-08].https://www.beijing.gov.cn/zhengce/zhengcefagui/qtwj/202204/t20220408_2669468.html.)

[54]国家发展改革委印发《“十四五”生物经济发展规划》[EB/OL].[2023-10-08].https://www.ndrc.gov.cn/xxgk/jd/jd/202205/t20220509_1324417.html?code=&state=123.(National Development and Reform Commission issues the "14th Five-Year Plan" for the development of the bioeconomy[EB/OL].[2023-10-08].https://www.ndrc.gov.cn/xxgk/jd/jd/202205/t20220509_1324417.html?code=&state=123.)

[55]关于印发深化医药卫生体制改革2023年下半年重点工作任务的通知[EB/OL].[2023-10-08].https://www.gov.cn/zhengce/zhengceku/202307/content_6894073.htm.(On the issuance of the deepening of the reform of the medical and health system in the second half of the 2023 key tasks[EB/OL].[2023-10-08].https://www.gov.cn/zhengce/zhengceku/202307/content_6894073.htm.)

[56]冯立杰,王文豪,王金凤,等.基于LDA-SNA和多维空间专利地图的核心技术主题及创新机会识别研究[J].科技管理研究,2023,43(5):165-174.(Feng L J,Wang W H,Wang J F,et al.Research on identification of core technology topics and innovation opportunities based on LDA-SNA and multi-dimensional space patent map[J].Science and Technology Management Research,2023,43(5):165-174.)

[57]王金凤,仵轩,张定堂,等.失效专利视域语义分析与多维技术创新地图融合的技术机会识别[J].数据分析与知识发现,2023,7(11):88-100.(Wang J F,Wu X,Zhang D T,et al.Identifying technical opportunities by semantic analysis of expired patents and multi-dimensional tech-innovation map[J].Data Analysis and Knowledge Dis-covery,2023,7(11):88-100.)


作者简介

冉从敬,教授,博士,博士生导师,研究方向为知识产权、大数据治理;

李旺(通讯作者),博士研究生,研究方向为数据科学、知识产权,Email:15147149291@163.com;

黄文俊,硕士研究生,研究方向为知识产权、数据主权。

*原文载于《信息资源管理学报》2024年第4期,欢迎个人转发,公众号转载请联系后台。


* 引用格式

冉从敬,李旺,黄文俊.高校高价值专利技术机会识别研究——以“生成式人工智能”领域为例[J].信息资源管理学报,2024,14(4):103-116.


往期 · 推荐

当期目录 | 2024年第4期

当期荐读 2024年第4期 | 科学与技术知识融合中的新近性与时域性作用研究

当期荐读 2024年第4期 | 数智时代的个人信息保护失范行为:AIGC赋能的扎根理论分析

当期荐读 2024年第4期 | 复合灾害谣言治理策略研究

当期荐读 2024年第4期 | 信息触达:灾害预警信息语言表达的影响研究



制版编辑 | 周凡倩

审核 | 于   媛



长按识别二维码关注我们

信息资源管理学报

微信号

xxzyglxb


分享在看点赞

只要你点,我们就是朋友😊


信息资源管理学报
《信息资源管理学报》是武汉大学主办、武汉大学信息管理学院和武汉大学信息资源研究中心承办的学术类期刊。双月刊,CSSCI来源期刊、中国人文社会科学核心期刊、人大复印报刊资料重要转载来源期刊。
 最新文章