【Python基础绘图】自定义函数，一键标注相关性热力图的显著性

文摘教育 2023-04-23 21:00 北京

# 引言

很早之前其实就写过一篇推文Python相关性热力图自动注显著性介绍如何在相关性热力图上自动标注显著性，不过收到好多同学私信，问我数据源是啥样的，怎么计算的啊，等等问题。所以今天打算重新写篇，并附上样例数据供大家参考学习。

# 读取数据

这次借助seaborn自带数据集的数据给大家来做演示，这边请忽略数据是否适用pearson相关性分析哈，实在是样例数据不太好找。你们自己整理数据，就整理成每列表示一个变量，这样就可以了。

df = sns.load_dataset('titanic')print(df)

# 计算相关性显著性

需要注意的是通过df.corr计算显著性时，变量自己与自己的显著性设置的是1，变量与其他的变量的显著性则无影响，是正确的，你也可以换个方法循环每个变量计算检查一下。

r_matrix = df.corr(method=lambda x, y: pearsonr(x, y)[0])print(r_matrix)p_matrix = df.corr(method=lambda x, y: pearsonr(x, y)[1])print(p_matrix)

# 可视化

fig,ax = plt.subplots(figsize=(8,6))mask = np.tril(np.ones(r_matrix.values.shape, dtype=int))mask = np.where(mask==1,0,1)print(mask)im1 = sns.heatmap(r_matrix,annot=True,cmap="RdBu_r", mask=mask#构造mask，去除重复数据显示,vmax=1,vmin=-1, fmt='.2f',ax = ax, annot_kws={"color": "k"})plt.show()

# 标注显著性

widthx = 0widthy = -0.15
for m in ax.get_xticks():    for n in ax.get_yticks():        pv = (p_matrix.values[int(m),int(n)])        if mask[int(m),int(n)]<1.:            if  pv< 0.05 and pv>= 0.01:                ax.text(n+widthx,m+widthy,'*',ha = 'center',color = 'k')            if  pv< 0.01 and pv>= 0.001:                ax.text(n+widthx,m+widthy,'**',ha = 'center',color = 'k')            if  pv< 0.001:                ax.text(n+widthx,m+widthy,'***',ha = 'center',color = 'k')

# 完整代码（封装函数）

# -*- encoding: utf-8 -*-'''@File    :   相关性.py@Time    :   2023/04/22 20:43:25@Author  :   HMX@Version :   1.0@Contact :   kzdhb8023@163.com'''
# here put the import libimport osimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom scipy.stats import pearsonrimport pandas as pd

def plot_p(df,pngpath,x=8,y=6,widthx = 0, widthy = -0.15):    '''    df:dataframe类型的数据    pngpath:输出图片的路径    x,y:图表的长宽    width,widthy:调节显著性标记点距离网格中心点的位移，一般默认就行，如发生与相关性系数有重叠或者遮挡的情况时可以手动调整    '''    # 计算相关性    r_matrix = df.corr(method=lambda x, y: pearsonr(x, y)[0])    # print(r_matrix)    # 计算显著性    p_matrix = df.corr(method=lambda x, y: pearsonr(x, y)[1])    # print(p_matrix)
    # 可视化    fig,ax = plt.subplots(figsize=(x,y))    # 构造mask    mask = np.tril(np.ones(r_matrix.values.shape, dtype=int))    mask = np.where(mask==1,0,1)    # 可视化相关性    im1 = sns.heatmap(r_matrix,annot=True,cmap="RdBu_r"    , mask=mask#构造mask，去除重复数据显示    ,vmax=1,vmin=-1    , fmt='.2f',ax = ax    , annot_kws={"color": "k"}    )    # 标注显著性    for m in ax.get_xticks():        for n in ax.get_yticks():            pv = (p_matrix.values[int(m),int(n)])            if mask[int(m),int(n)]<1.:                if  pv< 0.05 and pv>= 0.01:                    ax.text(n+widthx,m+widthy,'*',ha = 'center',color = 'k')                if  pv< 0.01 and pv>= 0.001:                    ax.text(n+widthx,m+widthy,'**',ha = 'center',color = 'k')                if  pv< 0.001:                    ax.text(n+widthx,m+widthy,'***',ha = 'center',color = 'k')    plt.tight_layout()    plt.savefig(pngpath,dpi = 600)
if __name__ == '__main__':    df = sns.load_dataset('titanic')    print(df)    pngpath = r'D:\ForestMeteorology\Study\相关性\GZH.png'    plot_p(df,pngpath)    plt.show()

欢迎私信交流学习

戳这里关注我

请点赞、在看、关注，你们的支持是我更新的动力。

http://mp.weixin.qq.com/s?__biz=MzkyNDI1NTY5MQ==&mid=2247488611&idx=1&sn=f6fce16cc55dc886cb64edd712c338cc

森气笔记

记录分享森林气象学相关的Python GEE Arcgis QGIS Matlab等学习笔记

最新文章

【森气随笔】Your Name in Landsat

【森气随笔】python绘图找不同揭秘不同函数绘图差异

【森气随笔】Python的bypy库高效管理百度网盘文件传输

【跟着SCI学作图】Matplotlib年龄结构图+堆积柱状图

【Python基础绘图】自定义函数，一键标注相关性热力图的显著性

【跟着SCI学作图】Matplotlib boxplot绘制箱线图

【跟着SCI学作图】Matplotlib fill_between绘制折线图的置信区间

【GDAL基础教程】Python投影栅格并计算栅格面积

【GDAL基础教程】Python设置栅格无效值并压缩

【Python基础绘图】Cartopy可视化Sentinel卫星影像

【跟着SCI学作图】Matplotlib pcolormesh可视化nc数据

【跟着SCI学作图】Matplotlib fill_between的简单应用

【跟着SCI学作图】Matplotlib&Seaborn绘制散点密度图&直方图

GEE request调用自定函数文件以批量下载sentinel影像和ndvi为例

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉