PyGWalker(读作“Pig Walker”,谐音梗 ),全称为:Python Binding of Graphic Walker。
PyGWalker用于简化Jupyter Notebook工作流。无需复杂的数据分析和数据可视化步骤,您可以使用PyGWalker把 pandas dataframe 转化为可交互的图形界面进行分析。想象一下:在Jupyter Notebook 中跑起来一个类Tableau/PowerBI风格的界面,通过简单的拖放操作,就可以完成数据分析和可视化的操作。
接下来,让我们一起来体验PyGWalker。
PyGWalker 支持大部分Jupyter环境(Jupyter Notebook, Juypter Lab等),以及其他的一些云端notebook。
在Google Colab使用pygwalker
Binder
Jupyter Lab
Visual Studio Code (建设当中ing)
在Kaggle Code中使用pygwalker
其他环境支持:
如果你还有其他运行环境的需求,欢迎和我们反馈。
在Jupyter Notebook 使用 PyGWalker
首先安装pygwalker:
pip install pygwalker
在Jupyter Notebook 中,引入pandas和pygwalker
import pandas as pd
import pygwalker as pyg
接下来,创建一个dataframe,只需调用pyg.walk方法,即可将datafame转化为一个可交互的可视化分析工具。
df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)
在这个生成的可视化分析工具当中, 通过拖拉拽等交互来进行可视化探索。左侧为所有可以选择的变量,你可以将他们拖拽到对应的视觉通道上来生成可视化。对于每一个变量,你可以修改他们的聚合方式(求和、平均、计数等)或是关闭聚合模式,分析明细数据的分布(通常用于散点图的分析)
你可以同时分析多个变量之间的关系,pygwalker支持复杂的分面系统,这使得你可以做高维的可视化分析。
在工具栏中,您可以将几何类型更改为其他类型以制作不同的图表,例如折线图:
通过放置多个度量来创建对比视图,对比多个指标之间的变化情况,如下图。
创建分面视图来比对不同维度类别下的数据分布情况
PyGWalker可以在你日常使用Juypter等工具进行数据分析时,帮你更快、以更加低代码的形式探索你的数据并制作可视化。PyGWalker可以在各类主流的python环境中运行,你甚至可以在一些数据竞赛平台如kaggle中做数据分析时,通过PyGWalker快速启动一个交互式分析工具来协助你。
欢迎试用体验PyGWalker,并和我们分享你的体验和建议~