matplotlib+pandas+jupyter-notebook
基于Python+matplotlib+pandas+jupyter-notebook的数据探索分析第二弹
数据分析可视化
使用了 Matplotlib 和 Seaborn 进行数据可视化,展示不同化妆品品牌的SKU(库存单位)数量分布情况,通过条形图,可以清晰地看到不同品牌的SKU数量分布情况。从图中可以观察到,悦诗风吟品牌的商品数量最多,其次是佰草集和欧莱雅,这反映了在数据集中这些品牌的产品种类和数量相对较多。
品牌总销量和总销售额
使用 Matplotlib 绘制了一个包含两个水平条形图的图形,使用水平条形图(barh plot)展示不同品牌的总销售量和总销售额,直观地比较不同品牌在销售量和销售额上的表现。
各类别的销售量、销售额情况
通过饼状图的形式,直观地展示各化妆品类别的销售量和销售额情况。从主类别销售量占比情况来看,护肤品的销量远大于化妆品;从子类别销售量占比情况来看,底妆类、口红类在化妆品中销量最多,清洁类、化妆水、面霜类在护肤品中销量最多。
各品牌不同类别的总销量和总销售额
绘制了一个分组条形图,用于展示不同品牌在不同类别下的总销量和总销售额。按品牌和子类别分组,计算每组的总销量和总销售额,可以看出各品牌的化妆品、护肤品销量、销售情况均不一样。
各品牌热度
使用 Matplotlib 绘制了一个条形图,用于展示不同品牌商品的平均评论数,按品牌分组,计算每个品牌的商品的平均评论数。通过品牌热度可视化,我们可以直观地比较不同品牌商品的平均评论数,帮助进一步分析消费者对各品牌商品的关注度和评价情况。如图显示,越靠上的品牌热度越高,越靠右的品牌销量越高,颜色越深圈越大价格越高,热度与销量呈现一定的正相关。
各品牌价格
使用 Matplotlib 和 Seaborn 绘制了一个箱型图,用于展示不同品牌商品的价格分布情况。通过这样的可视化,我们可以直观地比较不同品牌商品的价格分布情况,帮助进一步分析各品牌商品的定价策略和市场定位。
使用 Matplotlib 绘制了一个条形图,用于展示不同品牌产品的平均价格,并在图中添加了一条表示全品牌平均价格的红色水平线。可以直观地比较不同品牌产品的平均价格,并了解它们与全品牌平均价格的对比情况。
男性护肤品销量情况
创建一个针对男士专用的护肤品和化妆品的销量的条形图,展示男士专用的护肤品和化妆品的销量
创建两个水平条形图,分别显示男士护肤品销量和销售额的排名,男士购买的大多是护肤品;妮维雅是男生护肤品中销量遥遥领先的品牌,第二第三分别为欧莱雅、相宜本草。
分析时间与销量的关系,体现购买高峰期
绘制一个折线图,展示11月份每天的总销量,并设置了自定义的x轴刻度。通过折线图,可以直观地看到11月份每天的销量变化趋势。由于商家在双十一提前预热,巨大的优惠力度和为了避免网络高峰,不少消费者选择提前消费,销量高峰出现在双十一前几天;双十一后3天商家持续打折优惠,消费者还保有购物余热,但远不如双十一之前。
安装与使用
本项目在python3.8下通过测试,具体可以查看requirements中的环境要求,在这里出一个简单的项目使用教程,一般项目中的requirements.txt中包含了项目的python依赖环境,在安装好python的前提下只需要在cmd窗口中
pip install -r requirements.txt
有时候因为路径问题会提示requirements这个文件不存在,可以改为完整的路径,比如c:\requirements.txt,对于本项目只需要运行python manage.py runserver
,在pycharm的配置更为方便,可以不用每次都在终端输入命令使用。
获取方式
有需要的小伙伴可以通过后台联系方式获取,如果加不上可以后台留言留下联系方式,不经常看后台,但是看到了会回复的~,源码获取只收取很少的钱钱,除非是标记了For Free的。