前不久给大家更新了一份专利全库的数据:
1985~2024 年专利申请与授权数据(版本 3,含申请人所处的省市区县):https://rstata.duanshu.com/#/course/2397451274c546d3a36e156ffc865988
之前也给大家讲解过如何使用 Stata 提取和处理数字经济核心产业分类与国际专利分类参照关系表:
使用 Stata 提取和处理数字经济核心产业分类与国际专利分类参照关系表:https://rstata.duanshu.com/#/course/b2c71978336b4b39b69f05d6537d9d8f
使用课程中介绍的方法就可以获取到所有数字经济产业相关的专利分类表,之后根据专利分类表就可以进行数字经济产业相关专利的筛选了。今天给大家分享的就是筛选后的结果。
数据概览
历年数字经济产业相关专利数量
数据的时间范围为 1985~2024 年,各年数字经济产业相关专利申请数量变化如下图所示:
两种筛选结果
专利数据里面有分类号和主分类号两个变量,所以筛选的结果也分为两种:
根据分类号筛选; 根据主分类号筛选。
为了数据过于庞大的问题,我使用了三组文件存放这份数据,第一组是筛选得到的数字经济专利,按年拆分,里面有 newzlid 变量(每个 newzlid 对应一个专利):
基于分类号筛选的数字经济专利.zip 基于主分类号筛选的数字经济专利.zip
第二组是 newzlid 变量和 数字经济产业分类ID
的对照表:
基于分类号筛选的数字经济专利newzlid.dta 基于主分类号筛选的数字经济专利newzlid.dta
第三组是每个 数字经济产业分类 ID
的具体含义:
数字经济核心产业分类与国际专利分类参照关系表.dta
字段信息
数据包含如下变量:
newzlid、年份、公开公告号、专利名称、专利类型、摘要、申请人、申请号、申请日、授权公布号、地址、主权项、发明设计人、分类号、主分类号、专利代理机构、分案原申请号、优先权、国际申请、国际公布、代理人、省份或国家代码、专利领域、专利学科、多次公布、城市、所属国省、公开公告日、省、省代码、市、市代码、县、县代码、纬度、经度、参考文献、代码、发布路径、范畴分类、国别、名称、申请国代码、申请来源、邮编、页数、专利号、颁证日、审查员、进入国家日期、摘要附图存储路径
其中 newzlid 是我给专利的编号,包含 newzlid 变量的数据可以直接和这个数据使用该变量匹配;纬度、经度是根据申请人地址解析得到的;省、省代码、市、市代码、县、县代码是根据经纬度和 2021 年行政区划判断得到。
专利申请人地址分布
最后,下图展示了 2020 年数字经济产业相关专利申请人地址分布:
获取数据
是不是感觉很硬核!欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料(10元/份)详情可阅读这篇推文:数据处理、图表绘制、效率分析与计量经济学如何学习~
详情可点击阅读原文进入 RStata 学院了解(从首页的会员卡专区即可查看和购买会员卡)。
更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询:
附件下载(点击文末的阅读原文即可跳转):
https://rstata.duanshu.com/#/brief/course/d5dfb9ca0858457ebc4f176fce9fee80