Python实现峰峦图

文摘 2024-11-02 10:01 北京

峰峦图

峰峦图是一种展示数据核密度的图形方法，由于各种数据前后重叠像一重重山川而得名。峰峦图可以通过seaborn、joypy实现，也可以通过matplotlib实现。下面简单介绍这三种种峰峦图的统计方法。

matplotlib实现峰峦图

峰峦图实际上是一种统计图，不展示原始数据。所以我们需要先对数据进行统计。下面是虚构的一个站点的全年逐日平均数据：

假设我们试图展示逐月的日平均气温核密度，应该首先将这些数据按照月份分组（groupby），然后将平均气温分箱后（cut），统计各气温区间的分布数量（value_counts）。
首先是将时间列作为分组依据，调用dt属性后，使用month分组，这样我们将得到1-12月份的分组：

df.groupby(df['时间'].dt.month).groups.keys()

out_put:→dict_keys([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12])
我们可以使用for循环对每个分组操作，但pandas向我们提供了一个广播函数到所有分组的方法apply，所以我们到时候使用这个方法。
我们需要定义一个广播函数，我们将他命名为stats_temp:

def stats_temp(dataframe):
    #对输入的DataFrame分箱：
    cut_df=pd.cut(dataframe['平均气温'],bins=np.arange(-5,31,1))
    #统计各箱体气温数量
    stats_df=cut_df.value_counts(sort=False)
    return stats_df

对所有分组使用该函数后，我们将得到各月份的，各气温阶段的落区统计(非常有用的技巧，其他时间序列也可以通过这种方法快速统计，定义一个不错的函数在各分组apply，比for循环快还方便)：

df.groupby(df['时间'].dt.month).apply(stats_temp)

由于有十二个月，相当于要生成十二个ax，fig.add_axes或者subplot一个个添加太慢了，所以我们选择subplots：

fig,axes=plt.subplots(12,1)

再进行方方面面的美化修饰参数，并调节每张子图的垂直距离为负数，然后在每张ax上逐月绘制图像，通过plot和fill_between绘制峰峦。在循环中解除每张子图的axis，这样每张图像都不会产生遮挡。在运行到最后一张子图时，添加横坐标的气温坐标：

plt.rcParams['font.sans-serif']=['FangSong']
colors=mpl.colormaps['Spectral'].resampled(12)(range(12))
fig,axes=plt.subplots(12,1,**{'figsize':(5,3),'dpi':500})
fig.subplots_adjust(hspace=-0.7)
fig.suptitle(x=0.5,y=0.9,t='各月气温核密度分布',fontsize=10)
for i,ax in enumerate(axes.flatten()):
    ax.text(-2,0.5,'{}月'.format(i+1),fontsize=8)
    ax.plot(range(len(df_counts.iloc[i].values)),df_counts.iloc[i].values,lw=0.5,c=colors[i])
    ax.fill_between(range(len(df_counts.iloc[i].values)),
                    df_counts.iloc[i].values,
                    y2=0,
                    where=(df_counts.iloc[i].values>0),
                    interpolate=True,color=colors[i])
    ax.axis('off')
    if i==11:
        ax.set_xticks(range(len(df_counts.iloc[i].values))[::4])
        ax.set_xticklabels(np.arange(-5,31,1)[1::4])
        ax.axis('on')
        ax.spines[:].set_visible(False)
        ax.set_facecolor('none')
        ax.tick_params(labelsize=6,width=0.5)
        ax.yaxis.set_major_locator(mticker.NullLocator())
        ax.set_xlabel('气温',fontsize=6)

这里由于给出的cut分箱较大，同时样本量较少，锯齿较严重，但原理是不变的。也可以使用专门的核密度估计函数。这里是展示峰峦图的绘图原理。掌握了原理是不怕数据变的。

seaborn实现峰峦图

seaborn本来就是matplotlib的高级封装，提供了专门的命令来绘制图像，同时官网也有demo。

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
sns.set_theme(style="white", rc={"axes.facecolor": (0, 0, 0, 0)})

# Create the data
rs = np.random.RandomState(1979)
x = rs.randn(500)
g = np.tile(list("ABCDEFGHIJ"), 50)
df = pd.DataFrame(dict(x=x, g=g))
m = df.g.map(ord)
df["x"] += m

# Initialize the FacetGrid object
pal = sns.cubehelix_palette(10, rot=-.25, light=.7)
g = sns.FacetGrid(df, row="g", hue="g", aspect=15, height=.5, palette=pal)

# Draw the densities in a few steps
g.map(sns.kdeplot, "x",
      bw_adjust=.5, clip_on=False,
      fill=True, alpha=1, linewidth=1.5)
g.map(sns.kdeplot, "x", clip_on=False, color="w", lw=2, bw_adjust=.5)

# passing color=None to refline() uses the hue mapping
g.refline(y=0, linewidth=2, linestyle="-", color=None, clip_on=False)


# Define and use a simple function to label the plot in axes coordinates
def label(x, color, label):
    ax = plt.gca()
    ax.text(0, .2, label, fontweight="bold", color=color,
            ha="left", va="center", transform=ax.transAxes)


g.map(label, "x")

# 这一步其实也就是我们调节每个子图的命令，不难看出seaborn和matplotlib思路是一样的
g.figure.subplots_adjust(hspace=-.25)

# Remove axes details that don't play well with overlap
g.set_titles("")
g.set(yticks=[], ylabel="")
g.despine(bottom=True, left=True)

joypy实现峰峦图

joypy是专门绘制峰峦图的库。joypy自带核密度估计，我们只需要给出分组即可，不用另外进行统计。

import joypy
fig,axes=joypy.joyplot(df.groupby(df['时间'].dt.month))

http://mp.weixin.qq.com/s?__biz=MzkzMDYxNDYzOQ==&mid=2247487140&idx=2&sn=05dcd11c3021c0d8fb335854f9db97d1

气python风雨

主要发一些涉及大气科学的Python文章与个人学习备忘录

最新文章

论文写作 | AI辅助latex公式输入

文献阅读 | CD | 基于湿静能平衡的热带大尺度环流诊断模式

24年10月全球观测气象站点数据更新 | 下载教程

meteva读取风云卫星AWX格式与可视化

Python | 涡旋识别 | pyEddyTracker

雷达系列 | 如何绘制极坐标下的雷达数据

Python实现峰峦图

WRF | 关于ERROR: Error in ext_pkg_write_field

Matplotlib第三方扩展包生态

WRF | 探究报错could not find trapping x locations

论文绘图复习 | Nino | 时间序列绘制

有手就行的大模型教程：如何在个人电脑上部署盘古大模型

ECMWF | 下一代海洋和海冰集合再分析系统 | ORAS6

WRF | ERA5驱动所需要素下载以及注意事项

低空急流“预告”北京夏季夜间降雨

JMA台风路径数据处理：从PDF到CSV的转换指南

“千里眼”是怎么窥视强对流这个妖孽的？--天气雷达的扫描模式

大雪来了：强冷空气抵达广东北方多省下雪，大台风潭美酝酿或带来更冷天气

气象笔记 | 历史天气图与卫星云图查询指南

Python | Met Office | 爬取全球气象站点数据

论文绘图复现 | 如何绘制带有误差线的堆叠柱状图

十月新番 | 中气爱报道解读：一路向东的米尔顿、大雨落下的海伦妮

刺状急流与飓风“米尔顿”？？

WRF | 为什么wrfout中经向风和纬向风的格点数不一样

Python | ENSO | Nino区绘制

python | 基于geoplot重绘全国某要素分布图

新手画地图不再求人！Cartopy 绘图训练营上、下上线啦，免费学！

python|降水收支方程和垂直运动方程实现、气象统计绘图及CMIP6 数据处理

WRF | 如何解决WRF的ungrib报错GRIB文件类型不一致

Python | 台风生成点 | 判断海陆分布

ERA5 | 台风 | 基于ERA5数据的台风摩羯的气象动图制作

笔记 | 如何解决下载era5时告警deprecated API endpoint

读者答疑 | WRF如何减少or增加输出变量

基于geopandas的精美地图绘制：geoplot

Python | 集合滤波数据同化方法及其应用

GDOU研究进展 | 南印度洋热带气旋的破坏潜力正在下降

Python | 气象绘图 | 台风降水

Python | Gdal | 投影转换 | tiff转换nc

linux技巧 | Linux中按文件大小选择性复制文件

Python|基于长短期记忆神经网络（LSTM）模型实现对气象站点的降水量预测

Python | 台风GPI | Potential Intensity

GPM卫星数据下载、读取、绘图，一步到位——GPM-API库

Python | TN Wave Activity Flux | 三维TN波通量

Python | 绘制核密度图 | seaborn

雷达系列：两种基于雷达基数据绘制雷达CAPPI图的方式

Python | 计算可降水量

在雷达同化中建立水凝物的多变量相关以改善强降水预报

雷达系列：两种方法将气象雷达数据转为易处理的格式

CMAQ 5.4 输入与输出数据整理

在Jupyter环境中创建交互式可视化地图

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉