1929~2024 年 GSOD 气象站点数据

教育   2025-01-06 12:56   安徽  

在之前的课程中,我给大家介绍了如何使用 R 语言爬取 GSOD 气象站点数据的方法:

使用 R 语言爬取 1929~2023 年 GSOD 气象站点数据:https://rstata.duanshu.com/#/course/d4d95d88409e47cb91fbf6d165a8444c

GSOD 气象站点数据的网站结构非常简单,首页的链接是:https://www.ncei.noaa.gov/data/global-summary-of-the-day/access/。点进去就可以看到 1929~2024 年历年的链接了,选择某个年份点击进去就是各个文件的下载链接了。

有些小伙伴表示自己还不会 R 语言,所以我还是把这份数据整理好分享给大家。

数据概览

完整年份的数据包含超过 1 亿条观测值,因此我把这份数据拆分成了逐年的 csv 文件,需要注意的是 csv 文件不能直接使用 Excel 打开,否则会出现中文乱码(csv 文件是 UTF-8 编码的)以及观测值数量不足(Excel 最多只能显示 100 万多点的观测值)。大家可以使用 R 语言的 readr::read_csv() 读取或者使用 Stata 的 import delimited 读取。其他编程软件也有相应的读取方法。

例如 2022 年的数据内容如下:

将近 400 万条观测值,包含的变量如下:

  • 气象站代码(STATION)
  • 日期(DATE)
  • 纬度(LATITUDE)
  • 经度(LONGITUDE)
  • 气象站高程(ELEVATION):单位 m
  • 气象站名称(NAME)
  • 平均气温(TEMP):单位 ˚C
  • 平均气温属性(TEMP_ATTRIBUTES)
  • 平均露点(DEWP):单位 ˚C
  • 平均露点属性(DEWP_ATTRIBUTES)
  • 平均海平面压强(SLP):单位 hPa
  • 平均海平面压强属性(SLP_ATTRIBUTES)
  • 平均观测站压强(STP):单位 hPa
  • 平均观测站压强属性(STP_ATTRIBUTES)
  • 平均能见度(VISIB):单位 km
  • 平均能见度属性(VISIB_ATTRIBUTES)
  • 平均风速(WDSP):单位 m/s
  • 平均风速属性(WDSP_ATTRIBUTES)
  • 最大持续风速(MXSPD):单位 m/s
  • 最大持续风速属性(GUST):单位 m/s
  • 最高气温(MAX):单位 ˚C
  • 最高气温属性(MAX_ATTRIBUTES)
  • 最低气温(MIN):单位 ˚C
  • 最低气温属性(MIN_ATTRIBUTES)
  • 降水量(PRCP):单位 mm
  • 降水量属性(PRCP_ATTRIBUTES)
  • 积雪深度(SNDP):单位 mm
  • 指示器(FRSHTT)

相关指标的含义可以参考徐老师的这篇推文:GSOD全球逐日气象站点数据介绍与下载,部分指标的单位为了方便我的使用进行了转换,注解如上。

GSOD 气象站点分布

下图展示了数据中包含的气象站点分布:

中国及周边的站点分布:

获取数据

是不是感觉很硬核!欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料(10元/份)详情可阅读这篇推文:数据处理、图表绘制、效率分析与计量经济学如何学习~

详情可点击阅读原文进入 RStata 学院了解(从首页的会员卡专区即可查看和购买会员卡)。

更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询:

附件下载(点击文末的阅读原文即可跳转):

https://rstata.duanshu.com/#/brief/course/11c8a61e460c4f81a68435305310d63d


RStata
一起学习 R 语言和 Stata 吧!
 最新文章