大家好,我是欧K~
本期将利用Python分析「全国星巴克门店数据」,看看:我国各省份、各城市星巴克门店数量分布,营业时间分布情况等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
Pandas — 数据处理
Pyecharts — 数据可视化
import pandas as pd
from pyecharts.charts import Line
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Map
from pyecharts.charts import Geo
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
2.1 读取数据
df = pd.read_excel("./星巴克门店.xlsx")
2.2 查看数据信息
df.info()
2.3 计算营业时长
df['开始营业时间_1'] = pd.to_datetime(df['开始营业时间'])
df['停止营业时间_1'] = pd.to_datetime(df['停止营业时间'])
df['营业时长'] = df['停止营业时间_1'] - df['开始营业时间_1']
df['营业时长'] = pd.to_timedelta(df['营业时长'])
df['营业时长'] = df['营业时长'].dt.total_seconds()/3600
df['营业时长'] = df['营业时长'].apply(lambda x : x if x > 0 else x + 24)
2.4 营业时长区间
df['营业时长区间'] = pd.cut(df['营业时长'],bins=[0,8,10,12,14,16,24],labels=["0-8h","8-10h","10-12h","12-14h","14-16h","16-24h"])
def get_bar1(x_data, y_data)
bar1 = (
Bar(init_opts=opts.InitOpts(width='1000px', height='800px'))
.add_xaxis(x_data[::-1])
.add_yaxis("", y_data[::-1], label_opts=opts.LabelOpts(position="right"))
.reversal_axis()
.set_global_opts(
title_opts=opts.TitleOpts(
title='1-各省星巴克门店数量分布',
subtitle='-- 制图@公众号:Python当打之年 --',
pos_top='2%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
pos_top='70%',
pos_left='20%',
range_color=range_color
)
)
)
return bar1
上海市星巴克门店最多,超过了1000家。
广东省、浙江省、江苏省、北京市以超过500家的门店分列第二至五位。
def get_pie(x_data, y_data)
pie = (
Pie(
init_opts=opts.InitOpts(width='1000px', height='800px')
)
.add(series_name="",
data_pair=[list(z) for z in zip(x_data, y_data)],
radius=["30%",'50%'],
center=["38%", "50%"],
label_opts=opts.LabelOpts(is_show=False, position="center"),
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='各省星巴克门店数量占比',
subtitle='-- 制图@公众号:Python当打之年 --',
pos_top='2%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
max_=600,
pos_top='70%',
pos_left='20%',
range_color=range_color
),
legend_opts=opts.LegendOpts(is_show=True, pos_right="15%", pos_top="8%",orient="vertical"),
)
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))
)
return pie
def get_map(x_data, y_data)
map0 = (
Map(
init_opts=opts.InitOpts(width='1000px', height='600px')
)
.add("",
[list(z) for z in zip(x_data, y_data)],
maptype="china",
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='3-各省星巴克门店数量分布',
subtitle='-- 制图@公众号:Python当打之年 --',
pos_top='2%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
),
visualmap_opts=opts.VisualMapOpts(
is_show=True,
pos_top='70%',
pos_left='20%',
range_color=range_color
)
)
)
return map0
从地图分布上可以很直观地看出东南沿海地区星巴克门店数量要远高于其他地区。
从城市分布上看,北、上、广、深一线城市和杭州市星巴克门店数量均在200家以上,排在前五位。 星巴克门店数量200家以上的城市还有苏州市、成都市、宁波市。 南京市、武汉市、天津市、重庆市、西安市、无锡市等城市星巴克门店数量也在100家以上。
3.5 各城市星巴克门店数量热力图
def get_map(x_data, y_data)
line1 = (
Line(
init_opts=opts.InitOpts(width='1000px', height='600px')
)
.add_xaxis(x_data)
.add_yaxis("", y_data)
.set_global_opts(
title_opts=opts.TitleOpts(
title='6-开始营业时间分布',
subtitle='-- 制图@公众号:Python当打之年 --',
pos_top='2%',
pos_left="center",
title_textstyle_opts=opts.TextStyleOpts(color='#228be6',font_size=20)
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
pos_top='70%',
pos_left='20%',
range_color=range_color
)
)
)
return line1
星巴克门店开始营业时间大多数集中在早上06:45-07:45这个区间内,有很少一部分在晚上20:00以后。
3.7 星巴克门店停止营业时间分布
星巴克门店停止营业时间大多数集中在晚上21:00-22:00这个区间内,有很少一部分在晚上23:30以后。
3.8 星巴克门店营业时长区间分布
星巴克门店总营业时长相对来说还是比较长的,有3178家营业时长达到了14-16个小时,2075家在12-14小时,10-12小时的有1381家。 整体上营业时长10小时以上的占比达到了95%以上,14小时以上的占比约80%。
👉 公众号后台回复【可视化项目源码】获取全部代码+数据
在线运行地址(代码):https://www.heywhale.com/home/column/60e2740e3aeb9c0017b967a2
以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。
往期推荐
可视化 | Flask+Mysql+Echarts 豆瓣电影Top250数据分析系统
Pandas+Pyecharts | 当当网畅销图书榜单数据分析可视化
Pandas+Pyecharts | 海南旅游攻略数据分析可视化
Pandas+Pyecharts | 全国海底捞门店数据分析可视化
Pandas+Pyecharts | 京东某商品销量数据分析可视化
Pandas+Pyecharts | 第七次人口普查数据分析可视化
Pandas+Pyecharts | 快手APP全国大学生用户数据分析可视化
Pandas+Pyecharts | 奥迪汽车销量数据分析可视化
Pandas+Pyecharts | 剧荒了?用Python找找最近的热播好剧!
Pandas+Pyecharts | 2023年胡润百富榜数据分析可视化
Pandas+Pyecharts | 2023软科中国大学排名分析可视化
Pandas+Pyecharts | 成都大运会奖牌数据分析可视化
Pandas+Pyecharts | 电子产品销售数据分析可视化+用户RFM画像
Pandas+Pyecharts | 北京近五年历史天气数据可视化
Pandas+Pyecharts | 中国高校及专业数据分析可视化
Pandas+Pyecharts | 新冠疫情数据动态时序可视化
Pandas+Pyecharts | 全国吃穿住行消费排行榜,最‘抠门’的地区居然是北京!!!
Pandas+Pyecharts | 2022世界500强数据分析可视化
Pandas+Pyecharts | 上海市餐饮数据分析可视化
Pandas+Pyecharts | 山东省高考考生数据分析可视化
Pandas+Pyecharts | 20000+天猫订单数据可视化
Pandas+Pyecharts | 40000+汽车之家数据分析可视化
Pandas+Pyecharts | 广州市已成交房源信息数据可视化
Pandas+Pyecharts | 某直聘平台招聘信息数据可视化
可视化 | 分享一套Flask+Pyecharts可视化模板
用Python分析了3W+《独行月球》影评数据,看看观众们怎么说~