Pandas+Pyecharts | 全国星巴克门店数据分析可视化

科技   科技   2024-06-27 08:10   天津  
点击上方"蓝字",关注"Python当打之年"
后台回复"1",领取众多Python学习资料

大家好,我是欧K~

本期将利用Python分析「全国星巴克门店数据」,看看:我国各省份、各城市星巴克门店数量分布,营业时间分布情况等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。

涉及到的库:
Pandas — 数据处理
Pyecharts — 数据可视化
1. 导入模块

import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Map
from pyecharts.charts import Geo
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')


2. Pandas数据处理

2.1 读取数据

df = pd.read_excel("./星巴克门店.xlsx")

2.2 查看数据信息

df.info()

2.3 计算营业时长

df['开始营业时间_1'] = pd.to_datetime(df['开始营业时间'])
df['停止营业时间_1'] = pd.to_datetime(df['停止营业时间'])
df['营业时长'] = df['停止营业时间_1'] - df['开始营业时间_1']
df['营业时长'] = pd.to_timedelta(df['营业时长'])
df['营业时长'] = df['营业时长'].dt.total_seconds()/3600
df['营业时长'] = df['营业时长'].apply(lambda x : x if x > 0 else x + 24)

2.4 营业时长区间

df['营业时长区间'] = pd.cut(df['营业时长'],bins=[0,8,10,12,14,16,24],labels=["0-8h","8-10h","10-12h","12-14h","14-16h","16-24h"])


3. Pyecharts数据可视化

3.1 各省星巴克门店数量柱状图
def get_bar1(x_data, y_data)
    bar1 = (
        Bar(init_opts=opts.InitOpts(width='1000px', height='800px'))
        .add_xaxis(x_data[::-1])
        .add_yaxis("", y_data[::-1], label_opts=opts.LabelOpts(position="right"))
        .reversal_axis()
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='1-各省星巴克门店数量分布',
                subtitle='-- 制图@公众号:Python当打之年 --',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            )
        )
    )
    return bar1
  • 上海市星巴克门店最多,超过了1000家

  • 广东省、浙江省、江苏省、北京市超过500家的门店分列第二至五位

3.2 各省星巴克门店数量饼图
def get_pie(x_data, y_data)
    pie = (
        Pie(
            init_opts=opts.InitOpts(width='1000px', height='800px')
        )
        .add(series_name="",
             data_pair=[list(z) for z in zip(x_data, y_data)],
             radius=["30%",'50%'],
             center=["38%", "50%"],
             label_opts=opts.LabelOpts(is_show=False, position="center"),
             )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='各省星巴克门店数量占比',
                subtitle='-- 制图@公众号:Python当打之年 --',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
             visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                max_=600,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            ),
            legend_opts=opts.LegendOpts(is_show=True, pos_right="15%", pos_top="8%",orient="vertical"),
        )
        .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))
    )
    return pie

3.3 各省星巴克门店数量地图
def get_map(x_data, y_data)
    map0 = (
        Map(
            init_opts=opts.InitOpts(width='1000px', height='600px')
        )
        .add("",
             [list(z) for z in zip(x_data, y_data)],
             maptype="china",
            )
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='3-各省星巴克门店数量分布',
                subtitle='-- 制图@公众号:Python当打之年 --',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=True,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            )
        )
    )
    return map0
  • 从地图分布上可以很直观地看出东南沿海地区星巴克门店数量要远高于其他地区

3.4 各城市星巴克门店数量TOP20
  • 从城市分布上看,北、上、广、深一线城市和杭州市星巴克门店数量均在200家以上,排在前五位。
  • 星巴克门店数量200家以上的城市还有苏州市、成都市、宁波市。
  • 南京市、武汉市、天津市、重庆市、西安市、无锡市等城市星巴克门店数量也在100家以上

3.5 各城市星巴克门店数量热力图

3.6 星巴克门店开始营业时间分布
def get_map(x_data, y_data)
    line1 = (
        Line(
            init_opts=opts.InitOpts(width='1000px', height='600px')
        )
        .add_xaxis(x_data)
        .add_yaxis("", y_data)
        .set_global_opts(
            title_opts=opts.TitleOpts(
                title='6-开始营业时间分布',
                subtitle='-- 制图@公众号:Python当打之年 --',
                pos_top='2%',
                pos_left="center",
                title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
            ),
             visualmap_opts=opts.VisualMapOpts(
                is_show=False,
                pos_top='70%',
                pos_left='20%',
                range_color=range_color
            )
        )
    )
    return line1
  • 星巴克门店开始营业时间大多数集中在早上06:45-07:45这个区间内,有很少一部分在晚上20:00以后

3.7 星巴克门店停止营业时间分布

  • 星巴克门店停止营业时间大多数集中在晚上21:00-22:00这个区间内,有很少一部分在晚上23:30以后

3.8 星巴克门店营业时长区间分布

  • 星巴克门店总营业时长相对来说还是比较长的,3178家营业时长达到了14-16个小时2075家在12-14小时10-12小时的有1381家
  • 整体上营业时长10小时以上的占比达到了95%以上14小时以上的占比约80%

4. 源码
源码下载 | Python可视化系列文章资源(源码+数据)

👉 公众号后台回复【可视化项目源码】获取全部代码+数据

在线运行地址(代码)https://www.heywhale.com/home/column/60e2740e3aeb9c0017b967a2

END

以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。

 往期推荐 

源码下载 | Python可视化系列文章资源(源码+数据)

爬虫 | Python搞定软科中国大学排名

爬虫 | Python爬取胡润百富榜数据

爬虫 | Python爬取微博实时热搜榜信息

爬虫 | Python爬取B站榜排行榜信息

可视化 | Flask+Mysql+Echarts 豆瓣电影Top250数据分析系统

Pandas+Pyecharts | 当当网畅销图书榜单数据分析可视化

Pandas+Pyecharts | 海南旅游攻略数据分析可视化

Pandas+Pyecharts | 全国海底捞门店数据分析可视化

Pandas+Pyecharts | 京东某商品销量数据分析可视化

Pandas+Pyecharts | 第七次人口普查数据分析可视化

Pandas+Pyecharts | 快手APP全国大学生用户数据分析可视化

Pandas+Pyecharts | 奥迪汽车销量数据分析可视化

Pandas+Pyecharts | 剧荒了?用Python找找最近的热播好剧!

Pandas+Pyecharts | 2023年胡润百富榜数据分析可视化

Pandas+Pyecharts | 2023软科中国大学排名分析可视化

Pandas+Pyecharts | 成都大运会奖牌数据分析可视化

Pandas+Pyecharts | 电子产品销售数据分析可视化+用户RFM画像

Pandas+Pyecharts | 北京近五年历史天气数据可视化

Pandas+Pyecharts | 中国高校及专业数据分析可视化

Pandas+Pyecharts | 新冠疫情数据动态时序可视化

Pandas+Pyecharts | 全国吃穿住行消费排行榜,最‘抠门’的地区居然是北京!!!

Pandas+Pyecharts | 2022世界500强数据分析可视化

Pandas+Pyecharts | 上海市餐饮数据分析可视化

Pandas+Pyecharts | 山东省高考考生数据分析可视化

Pandas+Pyecharts | 20000+天猫订单数据可视化

Pandas+Pyecharts | 40000+汽车之家数据分析可视化

Pandas+Pyecharts | 广州市已成交房源信息数据可视化

Pandas+Pyecharts | 某直聘平台招聘信息数据可视化

可视化 | 再分享一套Flask+Pyecharts可视化模板二

可视化 | 分享一套Flask+Pyecharts可视化模板

可视化 | Python直观展示中国代表团冬奥会荣耀时刻

用Python分析了3W+《独行月球》影评数据,看看观众们怎么说~

Matplotlib | 世界足球俱乐部排名可视化

40000+条考研信息数据可视化(学校、专业分数分布)

【在看】的您又变好看了呢

Python当打之年
当打之年,专注于各领域Python技术,量的积累,质的飞跃。后台回复:【可视化项目源码】可获取可视化系列文章源码和数据
 最新文章