2013～2024 年上市公司与政府采购数据匹配结果

教育 2025-01-24 19:09 江西

之前给大家分享过一份爬取自中国政府采购网的政府采购数据：

2000～2024年3月政府采购合同公告数据：https://rstata.duanshu.com/#/course/90ab1a1c9bbd4640bb62ec4eebf61ce5

最近有小伙伴想把这份数据和上市公司数据匹配起来，由于两份数据都非常巨大，所以我就直接帮大家匹配好了。

匹配结果

上市公司与政府采购数据匹配结果的时间范围为 2013～2024 年，经过匹配之后一共得到了 41403 条匹配结果：

包含的变量如下：

供应商联系方式、年份、合同名称、详情链接、签订时间、发布时间、采购人、供应商、合同编号、项目编号、采购人地址、采购人联系方式、供应商地址、合同金额num_万元、主要标的名称、规格型号或服务要求、主要标的数量、主要标的单价、合同金额、履约期限和地点等简要信息、采购方式、所属地域、所属行业、代理机构、合同签订日期、合同公告日期、股票代码

下图展示了历年上市公司与政府采购数据匹配情况：

这里需要注意，匹配使用的政府采购数据是截至 2024 年 3 月 29 日的，所以 2024 年的数据还不够全。

匹配方法

结合上市公司数据与政府采购数据库的变量，使用上市公司的名称、曾用名等和采购合同数据中的供应商名称进行匹配。

首先需要分别处理上市公司数据公司列表和采购合同数据中的供应商名称。具体处理方法是剔除公司名称中干扰匹配的一些字符（股份有限、集团有限、有限责任、有限公司、有限、责任、股份、公司、厂、" "、(集团)、（集团）、（、）、(、)、回族自治区、壮族自治区、维吾尔自治区、自治区、省、市、区、县）。很多文献会说自己采用了模糊匹配，实际上在模糊匹配课程中，我讲过模糊匹配的缺点（匹配之后需要人工逐一检查，个人研究中难以实现，如果不检查又会有大量匹配错误的结果）。所以这里我采用的是去除干扰词汇匹配（插图来自工企专利匹配的推文，这里实际上是和上市公司数据企业名称匹配。）：

Stata 中的中文模糊匹配——以 2014 年工企数据和境外投资名录数据匹配为例：https://rstata.duanshu.com/#/course/d4fb816566244662ab6359fa848f1f1e

获取数据

是不是感觉很硬核！欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料（10元/份）详情可阅读这篇推文：数据处理、图表绘制、效率分析与计量经济学如何学习～

详情可点击阅读原文进入 RStata 学院了解（从首页的会员卡专区即可查看和购买会员卡）。

更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询：

附件下载（点击文末的阅读原文即可跳转）：
https://rstata.duanshu.com/#/brief/course/eeb80de262b441da94bd4894e8c993e4

RStata

一起学习 R 语言和 Stata 吧！

1985～2024 年数字经济产业相关专利筛选结果

2013～2024 年上市公司与政府采购数据匹配结果

1973～2024 年各省市区县平均能见度日度面板数据 & 栅格数据

RStata 平台课程与数据资料列表

欢迎购买 RStata 培训班学员学习 Stata、R 语言和实证分析！新增含数据资料额度的会员卡～

1985～2024 年上市公司与绿色低碳专利数据匹配结果

ggplot2 系列课程｜使用 ggplot2 绘制网络图

1973～2024 年各省市区县平均气温、最高温、最低温日度面板数据 & 栅格数据

更新！1985～2024 年专利申请与授权数据

ggplot2 系列课程｜使用 ggplot2 绘制地图——以中国地图为例

1973～2024 年中国各省市区县平均风速、最大阵风和最大持续风速日度面板数据 & 栅格数据

精细整理版！1949～2023 年工商企业注册信息数据（含国民经济行业代码、经纬度及其所属的省市区县）

1973～2024 年中国各省市区县累计降水量日度面板数据 & 栅格数据

名师讲堂｜使用 Stata 筛选绿色技术专利（国家知识产权局标准）

使用 Stata 匹配工商注册信息行业与国民经济行业代码

2007～2022 年中国各省市区县的太阳能面板面积数据

1998～2014 年工企与专利数据匹配结果（版本3，含申请与授权信息）

使用 Stata 绘制中国地图、世界地图、各省市地图课程汇总！还有单变量、双变量、三变量填充地图、网络图、栅格地图 ......

使用 R 语言绘制地图课程汇总索引

名师讲堂｜使用 Stata 处理专利数据的分类号

1929～2024 年 GSOD 气象站点数据

2007～2016 年税调企业与所在区县税务局的距离

名师讲堂｜使用 Stata 测算 Yitzhaki 指数和 Kakwani 指数——基于 CFPS 数据

1901~2023 年各省市区县月度潜在蒸散发面板数据

ggplot2 系列课程｜ggplot2 中的图层：单一图层、集合图层与统计变换

使用 Stata 绘制长三角 41 省市地图

欢迎购买 RStata 培训班学员学习 Stata、R 语言和实证分析！今日购买会员有神秘礼品赠送～

1985~2024年绿色低碳专利申请与授权数据

1980~2024 年观鸟记录、经纬度及其所处的省市区县数据（已更正）

使用 Stata 匹配工商注册信息行业与国民经济行业代码

CHAP-PM10月度：2000～2023 年各省市区县月度 PM10 浓度面板数据

CHAP-PM2.5年度：2000～2023 年各省市区县年度 PM2.5 浓度面板数据

CHAP-PM2.5月度：2000～2023 年各省市区县月度 PM2.5 浓度面板数据

CHAP-PM2.5日度：2000～2023 年各省市区县日度 PM2.5 浓度面板数据

2000~2023 年世界各国夜间灯光数据基尼系数、泰尔指数和阿特金森指数面板数据

使用 Stata 绘制山西省区县地图

2011 年～2024 年 3 月 22 日各省市气象相关百度指数面板数据

各省市区县地形位置指数平均值、最大值、最小值和标准差数据（地形起伏度）

1970～2023 年中国各省市区县、乡镇 CH4 排放量面板数据 & 栅格数据（EDGAR v2024）

1980~2024 年观鸟记录、经纬度及其所处的省市区县数据（已更正）

名师讲堂｜使用 Stata 测算数实融合水平

1990~2023 年上市公司办公地址及注册地址周边 1~300km 范围内各种类型金融机构的数量

1992~2020 年各省市区县城市建成区面积面板数据

2001～2021 年各省市区县空间形态紧凑度面板数据

2001~2021 年各省市区县不同作物种植制度的耕地面积

欢迎购买 RStata 培训班学员学习 Stata、R 语言和实证分析！新增含数据资料额度的会员卡～

RStata 平台课程与数据资料列表

1985~2024年上市公司与绿色专利数据匹配结果（国家知识产权局标准）

1970～2023 年中国各省市区县、各部门 CO2 总排放量(v2024_GHG)

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉