Python|格点数据插值到站点：最邻近插值和双三次插值算法

文摘 2024-07-19 22:07 四川

点击蓝字，关注我们

Python 格点数据插值到站点：

最邻近插值和双三次插值算法

作者：第八星系-李智

lizhi258147369@163.com

插值算法是图像缩放中的一项基本且重要的算法；在图像缩放中，输出图像像素点坐标可能对应输入图像上几个像素点之间的位置，这个时候就需要通过灰度插值处理来计算出该输出点的灰度值。图像插值是图像超分辨率的重要环节，不同的插值算法有不同的进度，插值算法的好坏也直接影像着图像的失真程度。常用的插值算法有以下三种：最近邻插值算法、双线性插值算法以及双三次插值算法。

最邻近插值算法

最邻近插值算法是最简单的插值算法，同时也叫零阶插值法。即选择它所映射位置最近的输入像素的灰度值为结果。对二维图像，是去待采样点周围4个相邻像素点中距离最近的1个点的灰度值作为待采样点的像素值。

下面是将网格数据插值到站点的代码示例：

from pathlib import Pathimport pandas as pdimport numpy as npimport netCDF4 as nc
# 读取站点信息stations_info = pd.read_excel(r'D:\ML\grid to stations\stations.xlsx', 'Sheet1', index_col=None, na_values=['NA'])
# 读取网格数据dataset = nc.Dataset(r"D:\ML\grid to stations\ERA5.TEST.nc")print(dataset)
# 经纬度longitude = dataset.variables['longitude'][:].datalatitude = dataset.variables['latitude'][:].data
# 温度t = dataset.variables['t'][:, :, :].data  # 获取所有时次的温度数据
# 将格点范围内的站点筛选出来lonSta, latSta = stations_info['经度'].to_numpy(), stations_info['纬度'].to_numpy()
# 定义获取最临近格点坐标索引的方法def nearest_position(stn_lat, stn_lon, lat2d, lon2d):    difflat = stn_lat - lat2d    difflon = stn_lon - lon2d    rad = np.multiply(difflat, difflat) + np.multiply(difflon, difflon)    aa = np.where(rad == np.min(rad))    ind = np.squeeze(np.array(aa))    return tuple(ind)
# 将一维的经纬度数据网格二维化lon2D, lat2D = np.meshgrid(longitude, latitude)
# 创建一个 DataFrame 用于存储插值数据t_sta_nearest_df = pd.DataFrame(index=range(len(lonSta)), columns=[f'{hour:02d}h' for hour in range(24)])
# 对每个站点进行插值计算for i in range(len(lonSta)):    t_nearest = []    for t_index in range(t.shape[0]):  # 对每个时间点进行操作        indexSta = nearest_position(latSta[i], lonSta[i], lat2D, lon2D)        jSta, iSta = indexSta[0], indexSta[1]        t_nearest.append(t[t_index, jSta, iSta])  # 将当前时间点的结果添加到列表中    t_sta_nearest_df.loc[i] = t_nearest
# 添加时间标题行t_sta_nearest_df.columns = [f'{hour:02d}h' for hour in range(24)]
# 将插值数据添加到站点信息 DataFrame 中stations_info = pd.concat([stations_info, t_sta_nearest_df], axis=1)
# 将数据保存为新的xlsx文件stations_info.to_excel('D:/ML/grid to stations/weather_station_data.xlsx', sheet_name='Sheet1', index=False)

双三次插值算法

双三次插值算法(Bicubic interpolation)又称立方卷积插值算法，是对双线性插值的改进，是一种比较复杂的插值方式，它不仅考虑到周围4个像素点灰度值的影像，还考虑到它们灰度值变化率的影像。该算法需要利用待采样附近16个像素点的灰度值作三次插值进行计算。

下面是代码示例

from pathlib import Pathimport pandas as pdimport numpy as npimport netCDF4 as ncfrom scipy.interpolate import griddata
# 读取站点信息stations_info = pd.read_excel(r'D:\ML\grid to stations\stations.xlsx', 'Sheet1', index_col=None, na_values=['NA'])
# 读取网格数据dataset = nc.Dataset(r"D:\ML\grid to stations\ERA5.TEST.nc")
# 经纬度longitude = dataset.variables['longitude'][:].datalatitude = dataset.variables['latitude'][:].data
# 温度t = dataset.variables['t'][:, :, :].data  # 获取所有时次的温度数据
# 将格点范围内的站点筛选出来lonSta, latSta = stations_info['经度'].to_numpy(), stations_info['纬度'].to_numpy()
# 将一维的经纬度数据网格化lon2D, lat2D = np.meshgrid(longitude, latitude)
# 创建一个 DataFrame 用于存储插值数据t_sta_nearest_df = pd.DataFrame(index=range(len(lonSta)), columns=[f'{hour:02d}h' for hour in range(24)])
# 对每个站点进行插值计算for i in range(len(lonSta)):    t_nearest = []    for t_index in range(t.shape[0]):  # 对每个时间点进行操作        t_values = t[t_index, :, :].flatten()  # 获取当前时间点的所有温度值        grid_points = np.vstack((lon2D.flatten(), lat2D.flatten())).T  # 网格坐标        station_point = np.array([[lonSta[i], latSta[i]]])  # 站点坐标        t_interp = griddata(grid_points, t_values, station_point, method='cubic')  # 双三次插值        t_nearest.append(t_interp[0])  # 将插值结果添加到列表中    t_sta_nearest_df.loc[i] = t_nearest
# 添加时间标题行t_sta_nearest_df.columns = [f'{hour:02d}h' for hour in range(24)]
# 将插值数据添加到站点信息 DataFrame 中stations_info = pd.concat([stations_info, t_sta_nearest_df], axis=1)
# 将数据保存为新的xlsx文件stations_info.to_excel('D:/ML/grid to stations/weather_station_data_SSC.xlsx', sheet_name='Sheet1', index=False)

后台私信：第八星系

群内每日更新分享数据

进群请勿回复第八星系以外字词

本文编辑：第八星系欣悦

分享、在看与点赞，至少我要拥有一个吧

第八星系人造大气理论爱好者

记录与交流python、matlab等科研工具。记录与交流大气科学的学科知识

最新文章

python基于站点经纬度绘制降水空间散点分布图

关于本公众号后台不回复的说明及加入交流群的方式

code详解 | 用python实现气象局降水相态图的绘制

两种降水站点数据克里金插值及可视化方法

三分钟学会气象要素六边形分布绘制

Python|基于python利用多年降水日数据计算逐年逐季节各站点降水日数

利用MATLAB求臭氧MDA8数据第90百分位数

重磅！2024中国大学大气科学、应用气象学等专业排名

重磅！北京师范大学地表过程与资源生态国家重点实验室段建平、效存德等在 BAMS 发表最新研究进展

TP-PROFILE：监测第三极对流层大气热动力结构的观测网

利用Python计算质量流函数（MSF）表征哈德来环流

数据文章|三种不同大涡模式模拟的浅对流数据集

小波系数实部等值线图和小波系数方差图的绘制

对于生活在难民营中的三位女性来说，极端天气意味着什么？

在正与严酷夏季作斗争的巴基斯坦，每天都有上百人在卡拉奇死去

机器学习-随机森林回归（上）

机器学习-随机森林回归（下）

深度学习 | N卡pytorch框架GPU版本安装

Linux基础教程|ip地址&主机名&配置固定IP

Python读取 .txt 文件绘制温度-盐度-溶解氧垂直剖面图

多Y轴柱状图（以3Y轴为例）

MATLAB绘制柱状剖面组合图

Python读取.mat数据并绘制1950~2019年的nino3.4时间序列

Matlab进阶绘图-方块热图灵活版

MATLAB|编辑器打开脚本无代码的解决措施

深度学习|安装图神经网络必备神器PyTorch Geometric

Linux基础教程|ip地址&主机名&配置固定IP

如何绘制wrfout文件的垂直速度变量

机器学习 | 第一部分：引言与基础 1

利用Python计算质量流函数（MSF）表征哈德来环流

基于python自动定时从天擎下载中国气象局全球天气模式CMA-GFS下发产品-东北半球分析产品并插值到站点且生成.csv文件上

雷达系列：必须更新！测试cinrad最新更新的read_auto

刘海龙团队|南海中尺度涡轨迹可预报性期限研究

Python|格点数据插值到站点：最邻近插值和双三次插值算法

机器学习 | 第一部分：引言与基础 1

关于本公众号后台不回复的说明及加入交流群的方式

Matlab--EOF分析

MATLAB小白入门04-03—简单折线图

预出版|基于长期观测的二维视频滴谱仪对西藏羊八井地区降雨微物理特征的研究

CMORPH降水数据下载

深度学习|安装图神经网络必备神器PyTorch Geometric

关于本公众号后台不回复的说明及加入交流群的方式

机器学习 | 第一部分：引言与基础 2

MATLAB 绘制夏季海表流场

中国大气复合污染专题| 不同气象条件下前体物减排控制大气污染的有效性

常见地图白化方法（二）

两种micaps站点数据的简单绘制方法

初伏-未晓雨先骤，过朝风更鲜。

关于本公众号后台不回复的说明及加入交流群的方式

在Windows系统中安装Git

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉