注意这里介绍的是 绿色低碳专利,和之前分享的 绿色专利 的筛选标准是不同的。
上次给大家分享了 1998~2024 的专利申请和授权信息:
1985~2024 年专利申请与授权数据(版本 3,含申请人所处的省市区县):https://rstata.duanshu.com/#/brief/course/2397451274c546d3a36e156ffc865988
绿色专利 的链接在这里:
1985~2024 年绿色专利申请与授权数据(国家知识产权局标准):https://rstata.duanshu.com/#/brief/course/9cfa513db3a54891bef466caac9e6a62
最近有小伙伴想使用根据 国家知识产权局标准 筛选绿色低碳专利数据,于是我就根据这个数据筛选了下。
附件中的 绿色低碳技术专利分类体系.pdf
文件下载自国家知识产权局。该分类筛选标准大概是这样的:
筛选标准中有全部涉及和部分涉及,其中全部涉及表示该分类号对应的专利均为绿色低碳专利,部分涉及还需要结合标题和摘要进行关键词识别:
需要注意的是:
也就是说如果绿色低碳专利分类号标准是 E02B9/00,那么 E02B9/08 也是属于该类别。这个虽然有悖于大组和小组的关系,但是根据知识产权局的回复来看,确实得这样。
数据格式提供的是 Stata 读取的 dta 文件,例如 2010 年筛选结果:
下图展示了 2022 年各城市绿色低碳专利授权量:
1985~2024年各省市绿色低碳专利申请数量变化:
2021 年各区县绿色低碳发明专利申请量:
2021 年各省份绿色低碳实用新型专利授权量:
处理方法
关于该筛选方法,过段时间我再整理个课程讲解下~
专利引用及被引用信息
由于专利引用及被引用信息也非常巨大,这里就不再加进来了,如果需要引用及被引用信息,可以使用 ipzlid 变量和之前分享的这个数据匹配:
1998~2024 的专利引用与被引用信息及次数统计:https://rstata.duanshu.com/#/brief/course/de4968acb01047b3801c200e9cf7ed41
注意事项
该数据中存在重复专利,有两种原因:
该专利数据两个绿色低碳专利类别; 该专利的申请公告和授权公告都在数据中。
统计的时候可以先去除公开公告号里面的 A、B、U、S。其中 A 代表发明专利的申请公开,B 代表发明专利的授权公告,U 代表实用新型专利的授权公告,S 代表外观设计专利的授权公告。代码大致如下:
replace 公开公告号 = subinstr(公开公告号, "A", "", .)
replace 公开公告号 = subinstr(公开公告号, "B", "", .)
replace 公开公告号 = subinstr(公开公告号, "U", "", .)
replace 公开公告号 = subinstr(公开公告号, "S", "", .)
replace 专利类型 = "发明" if index(专利类型, "发明")
*- 使用 duplicates drop 去除重复的
duplicates drop 公开公告号, force
如果需要分类别统计数量,则要分类别 duplicates drop。
附件中也提供了分省市区县、类型绿色低碳专利申请与授权量统计结果:
1985~2024年分省市区县、类型绿色低碳专利申请与授权量.dta
附件中还提供了 2024绿色低碳专利统计分析报告.pdf
,我筛选的绿色低碳专利比该报告给出的数量多,不过我仔细检查了筛选过程并没发现问题。不知道是不是报告里面的数据还有其他限制条件。
获取数据
是不是感觉很硬核!欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料(10元/份)详情可阅读这篇推文:数据处理、图表绘制、效率分析与计量经济学如何学习~
详情可点击阅读原文进入 RStata 学院了解(从首页的会员卡专区即可查看和购买会员卡)。
更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询:
附件下载(点击文末的阅读原文即可跳转):
https://rstata.duanshu.com/#/brief/course/4ff9f743d3ec49748ae76cbf04725313