CMORPH降水数据下载

文摘 2024-07-18 09:00 河北

来自交流群的读友分享

结合官方网站和下面代码，可自由定制符合自己需求的下载任务。

https://www.ncei.noaa.gov/data/cmorph-high-resolution-global-precipitation-estimates/access/

#-*- coding: utf-8 -*-
import calendar
import os
import requests
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util.retry import Retry

def getLegalUrl(year, mon, day, time):
    base_url = "https://www.ncei.noaa.gov/data/cmorph-high-resolution-global-precipitation-estimates/access/30min/8km/"
    url_preletter = 'CMORPH_V1.0_ADJ_8km-30min_'
    url = base_url + str(year) + '/' + str(mon).zfill(2) + '/' + str(day).zfill(2) + '/' + url_preletter + str(year) + str(mon).zfill(2) + str(day).zfill(2) + str(time).zfill(2) + '.nc'
    return url

def getfilename(year, mon, day, time):
    filename_preletter = 'CMORPH_V1.0_ADJ_8km-30min_'
    filename = filename_preletter + str(year) + str(mon).zfill(2) + str(day).zfill(2) + str(time).zfill(2) + '.nc'
    return filename

def download_file(url, save_path):
    session = requests.Session()
    
    # 创建一个重试机制
    retries = Retry(total=5, backoff_factor=1, status_forcelist=[502, 503, 504])
    session.mount('https://', HTTPAdapter(max_retries=retries))

    try:
        response = session.get(url, timeout=60)
        if response.status_code == 200:
            with open(save_path, 'wb') as file:
                file.write(response.content)
            return True
        else:
            return False
    except requests.exceptions.RequestException as e:
        print(f"网络错误: {e}")
        return False

if __name__ == '__main__':
    f = open("D:\\CMORPH_data\\all_file_url.txt", "a")
    failed_files = []
    success_count = 0
    fail_count = 0

    for year in [2021, 2022]:
        for mon in [6, 7, 8]:
            days = calendar.monthrange(year, mon)[1]  # 查找某年某月有多少天
            save_path = 'D:\\CMORPH_data\\' + str(year) + '\\' + str(mon).zfill(2) + '\\'  # 保存的目的文件夹

            # 检查目录是否存在，如果不存在则创建
            current_dir = 'D:\\CMORPH_data'
            for dir in [str(year), str(mon).zfill(2)]:
                current_dir = os.path.join(current_dir, dir)
                if not os.path.exists(current_dir):
                    print(f"目录 {current_dir} 不存在，尝试创建...")
                    try:
                        os.mkdir(current_dir)
                        print(f"成功创建目录：{current_dir}")
                    except Exception as e:
                        print(f"创建目录 {current_dir} 时发生错误：{e}")
                        continue

            for day in range(1, days+1):  # 第一次下载文件
                for time in range(0, 24):
                    print(year, mon, day, time)
                    url = getLegalUrl(year, mon, day, time)
                    filename = getfilename(year, mon, day, time)
                    file_path = os.path.join(save_path, filename)
                    f.write(url + '\n')
                    
                    if not os.path.exists(file_path):
                        if download_file(url, file_path):
                            print(f"文件 {filename} 已成功下载")
                            success_count += 1
                        else:
                            print(f"文件 {filename} 下载失败")
                            fail_count += 1
                            failed_files.append(file_path)
                    else:
                        print(f"文件 {filename} 已存在，跳过下载")

    # 重试下载失败的文件
    retry_count = 0
    while failed_files and retry_count < 10:
        retry_count += 1
        print(f"开始第 {retry_count} 次重试...")
        for file_path in failed_files:
            url = getLegalUrl(year, mon, day, time)
            if download_file(url, file_path):
                print(f"文件 {filename} 已成功下载")
                success_count += 1
                fail_count -= 1
                failed_files.remove(file_path)
            else:
                print(f"文件 {filename} 下载失败")

    # 如果仍有下载失败的文件，将它们的名字保存到一个文件中
    if failed_files:
        with open("D:\\CMORPH_data\\failed_files.txt", "w") as fail_file:
            for file_path in failed_files:
                fail_file.write(file_path + '\n')

    f.close()
    print(f'下载完成，成功下载 {success_count} 个文件，失败 {fail_count} 个文件.')

历史文章推荐

Python+AI+气象+模式大合集

欢迎添加小编微信进交流群

第八星系人造大气理论爱好者

记录与交流python、matlab等科研工具。记录与交流大气科学的学科知识

最新文章

python基于站点经纬度绘制降水空间散点分布图

关于本公众号后台不回复的说明及加入交流群的方式

code详解 | 用python实现气象局降水相态图的绘制

两种降水站点数据克里金插值及可视化方法

三分钟学会气象要素六边形分布绘制

Python|基于python利用多年降水日数据计算逐年逐季节各站点降水日数

利用MATLAB求臭氧MDA8数据第90百分位数

重磅！2024中国大学大气科学、应用气象学等专业排名

重磅！北京师范大学地表过程与资源生态国家重点实验室段建平、效存德等在 BAMS 发表最新研究进展

TP-PROFILE：监测第三极对流层大气热动力结构的观测网

利用Python计算质量流函数（MSF）表征哈德来环流

数据文章|三种不同大涡模式模拟的浅对流数据集

小波系数实部等值线图和小波系数方差图的绘制

对于生活在难民营中的三位女性来说，极端天气意味着什么？

在正与严酷夏季作斗争的巴基斯坦，每天都有上百人在卡拉奇死去

机器学习-随机森林回归（上）

机器学习-随机森林回归（下）

深度学习 | N卡pytorch框架GPU版本安装

Linux基础教程|ip地址&主机名&配置固定IP

Python读取 .txt 文件绘制温度-盐度-溶解氧垂直剖面图

多Y轴柱状图（以3Y轴为例）

MATLAB绘制柱状剖面组合图

Python读取.mat数据并绘制1950~2019年的nino3.4时间序列

Matlab进阶绘图-方块热图灵活版

MATLAB|编辑器打开脚本无代码的解决措施

深度学习|安装图神经网络必备神器PyTorch Geometric

Linux基础教程|ip地址&主机名&配置固定IP

如何绘制wrfout文件的垂直速度变量

机器学习 | 第一部分：引言与基础 1

利用Python计算质量流函数（MSF）表征哈德来环流

基于python自动定时从天擎下载中国气象局全球天气模式CMA-GFS下发产品-东北半球分析产品并插值到站点且生成.csv文件上

雷达系列：必须更新！测试cinrad最新更新的read_auto

刘海龙团队|南海中尺度涡轨迹可预报性期限研究

Python|格点数据插值到站点：最邻近插值和双三次插值算法

机器学习 | 第一部分：引言与基础 1

关于本公众号后台不回复的说明及加入交流群的方式

Matlab--EOF分析

MATLAB小白入门04-03—简单折线图

预出版|基于长期观测的二维视频滴谱仪对西藏羊八井地区降雨微物理特征的研究

CMORPH降水数据下载

深度学习|安装图神经网络必备神器PyTorch Geometric

关于本公众号后台不回复的说明及加入交流群的方式

机器学习 | 第一部分：引言与基础 2

MATLAB 绘制夏季海表流场

中国大气复合污染专题| 不同气象条件下前体物减排控制大气污染的有效性

常见地图白化方法（二）

两种micaps站点数据的简单绘制方法

初伏-未晓雨先骤，过朝风更鲜。

关于本公众号后台不回复的说明及加入交流群的方式

在Windows系统中安装Git

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉