PyGWalker:将你的pandas dataframe变成交互式可视化分析工具

教育   2024-11-05 16:01   广东  



PyGWalker(读作“Pig Walker”,谐音梗 ),全称为:Python Binding of Graphic Walker。

PyGWalker用于简化Jupyter Notebook工作流。无需复杂的数据分析和数据可视化步骤,您可以使用PyGWalker把 pandas dataframe 转化为可交互的图形界面进行分析。想象一下:在Jupyter Notebook 中跑起来一个类Tableau/PowerBI风格的界面,通过简单的拖放操作,就可以完成数据分析和可视化的操作。

接下来,让我们一起来体验PyGWalker。

PyGWalker 支持大部分Jupyter环境(Jupyter Notebook, Juypter Lab等),以及其他的一些云端notebook。


在Google Colab使用pygwalker


    在Kaggle Code中使用pygwalker



    其他环境支持:

  • Binder

  • Jupyter Lab

  • Visual Studio Code (建设当中ing)

如果你还有其他运行环境的需求,欢迎和我们反馈。

在Jupyter Notebook 使用 PyGWalker

首先安装pygwalker:

pip install pygwalker

在Jupyter Notebook 中,引入pandas和pygwalker

import pandas as pdimport pygwalker as pyg

接下来,创建一个dataframe,只需调用pyg.walk方法,即可将datafame转化为一个可交互的可视化分析工具。

df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])gwalker = pyg.walk(df)


在这个生成的可视化分析工具当中, 通过拖拉拽等交互来进行可视化探索。左侧为所有可以选择的变量,你可以将他们拖拽到对应的视觉通道上来生成可视化。对于每一个变量,你可以修改他们的聚合方式(求和、平均、计数等)或是关闭聚合模式,分析明细数据的分布(通常用于散点图的分析)

你可以同时分析多个变量之间的关系,pygwalker支持复杂的分面系统,这使得你可以做高维的可视化分析。


在工具栏中,您可以将几何类型更改为其他类型以制作不同的图表,例如折线图:

通过放置多个度量来创建对比视图,对比多个指标之间的变化情况,如下图。

创建分面视图来比对不同维度类别下的数据分布情况

PyGWalker可以在你日常使用Juypter等工具进行数据分析时,帮你更快、以更加低代码的形式探索你的数据并制作可视化。PyGWalker可以在各类主流的python环境中运行,你甚至可以在一些数据竞赛平台如kaggle中做数据分析时,通过PyGWalker快速启动一个交互式分析工具来协助你。

欢迎试用体验PyGWalker,并和我们分享你的体验和建议~

算法数据侠
Hi, 今日的你比昨日更优秀!算法数据侠致力于最全最优质的AI算法与数据集分享,不定期更新AI算法/数据集、竞赛TOP方案和前沿学术速递,期待各位小侠客共勉!
 最新文章