1985~2024年绿色低碳专利申请与授权数据

教育   2024-12-30 14:08   安徽  

注意这里介绍的是 绿色低碳专利,和之前分享的 绿色专利 的筛选标准是不同的。

上次给大家分享了 1998~2024 的专利申请和授权信息:

1985~2024 年专利申请与授权数据(版本 3,含申请人所处的省市区县):https://rstata.duanshu.com/#/brief/course/2397451274c546d3a36e156ffc865988

绿色专利 的链接在这里:

1985~2024 年绿色专利申请与授权数据(国家知识产权局标准):https://rstata.duanshu.com/#/brief/course/9cfa513db3a54891bef466caac9e6a62

最近有小伙伴想使用根据 国家知识产权局标准 筛选绿色低碳专利数据,于是我就根据这个数据筛选了下。

附件中的 绿色低碳技术专利分类体系.pdf 文件下载自国家知识产权局。该分类筛选标准大概是这样的:

筛选标准中有全部涉及和部分涉及,其中全部涉及表示该分类号对应的专利均为绿色低碳专利,部分涉及还需要结合标题和摘要进行关键词识别:

需要注意的是:

也就是说如果绿色低碳专利分类号标准是 E02B9/00,那么 E02B9/08 也是属于该类别。这个虽然有悖于大组和小组的关系,但是根据知识产权局的回复来看,确实得这样。

数据格式提供的是 Stata 读取的 dta 文件,例如 2010 年筛选结果:

下图展示了 2022 年各城市绿色低碳专利授权量:

1985~2024年各省市绿色低碳专利申请数量变化:

2021 年各区县绿色低碳发明专利申请量:

2021 年各省份绿色低碳实用新型专利授权量:

处理方法

关于该筛选方法,过段时间我再整理个课程讲解下~

专利引用及被引用信息

由于专利引用及被引用信息也非常巨大,这里就不再加进来了,如果需要引用及被引用信息,可以使用 ipzlid 变量和之前分享的这个数据匹配:

1998~2024 的专利引用与被引用信息及次数统计:https://rstata.duanshu.com/#/brief/course/de4968acb01047b3801c200e9cf7ed41

注意事项

该数据中存在重复专利,有两种原因:

  • 该专利数据两个绿色低碳专利类别;
  • 该专利的申请公告和授权公告都在数据中。

统计的时候可以先去除公开公告号里面的 A、B、U、S。其中 A 代表发明专利的申请公开,B 代表发明专利的授权公告,U 代表实用新型专利的授权公告,S 代表外观设计专利的授权公告。代码大致如下:

replace 公开公告号 = subinstr(公开公告号, "A""", .)
replace 公开公告号 = subinstr(公开公告号, "B""", .)
replace 公开公告号 = subinstr(公开公告号, "U""", .)
replace 公开公告号 = subinstr(公开公告号, "S""", .)
replace 专利类型 = "发明" if index(专利类型, "发明")
*- 使用 duplicates drop 去除重复的
duplicates drop 公开公告号, force 

如果需要分类别统计数量,则要分类别 duplicates drop

附件中也提供了分省市区县、类型绿色低碳专利申请与授权量统计结果:

1985~2024年分省市区县、类型绿色低碳专利申请与授权量.dta

附件中还提供了 2024绿色低碳专利统计分析报告.pdf,我筛选的绿色低碳专利比该报告给出的数量多,不过我仔细检查了筛选过程并没发现问题。不知道是不是报告里面的数据还有其他限制条件。

获取数据

是不是感觉很硬核!欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料(10元/份)详情可阅读这篇推文:数据处理、图表绘制、效率分析与计量经济学如何学习~

详情可点击阅读原文进入 RStata 学院了解(从首页的会员卡专区即可查看和购买会员卡)。

更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询:

附件下载(点击文末的阅读原文即可跳转):

https://rstata.duanshu.com/#/brief/course/4ff9f743d3ec49748ae76cbf04725313


RStata
一起学习 R 语言和 Stata 吧!
 最新文章