点击上方"蓝字",关注"Python当打之年"
全国哪些城市岗位数量比较多
哪些公司薪资待遇比较好
哪些岗位需求量比较大
普遍工资分布情况
目录
1. 导入模块
2.Pandas数据处理
2.1 读取数据
2.2 查看索引、数据类型和内存信息
2.3 缺失值填充
2.4 列拆分
2.5 删除列
2.6 列重命名
2.7 薪资列处理(拆分、时薪、日薪转换)
3. Pyecharts数据可视化
3.1 招聘数量前20的城市柱状图
3.2 平均薪资前20的城市柱状图
3.3 最高薪资前十的公司柱状图(纵向)
3.4 各岗位占比饼图
3.5 经验学历要求占比饼图
3.6 招聘公司所在领域占比饼图
3.7 招聘城市分布地图
3.8 福利词云图
可视化部分需要用到 pyecharts==1.9.1。
# 导包
import re
import stylecloud
import pandas as pd
from PIL import Image
from pyecharts.charts import Bar
from pyecharts.charts import Map
from pyecharts.charts import Pie
from pyecharts import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.globals import SymbolType
from pyecharts.globals import ThemeType
df = pd.read_excel('boss岗位.xlsx')
df.head()
2.2 查看索引、数据类型和内存信息
df.info()
福利列用"无"填充:
df['福利'].fillna('无',inplace=True)
df.isnull().sum()
2.4 列拆分(地区列拆分为城市、城区、地址三列)
df1 = df.copy()
df1[['城市', '城区','地址']] = df1['地区'].str.split('·', 3, expand = True)
df1.head(3)
这里我们删除地区列和详情页列:
df1.drop(['地区','详情页'],axis=1, inplace=True)
我们将标题重命名为岗位,公司名重命名为公司名称:
df1.rename(columns={"标题": "岗位", "公司名": "公司名称"},inplace=True)
薪资列将日薪和时薪转换为月薪:
b1 = (
Bar(init_opts=opts.InitOpts(theme=ThemeType.DARK,bg_color=JsCode(color_js1),width='1000px',height='600px'))
.add_xaxis(x_data)
.add_yaxis('',
y_data ,
category_gap="50%",
)
.set_global_opts(
title_opts=opts.TitleOpts(title='招 聘 数 量 前 20 的 城 市'),
legend_opts=opts.LegendOpts(is_show=False),
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),
yaxis_opts=opts.AxisOpts(name="",
name_location='middle',
name_gap=40,
name_textstyle_opts=opts.TextStyleOpts(font_size=16)),
datazoom_opts=[opts.DataZoomOpts(range_start=1,range_end=50)]
)
)
pie = ( Pie(init_opts=opts.InitOpts(theme=ThemeType.DARK,width='1000px',height='600px'))
.add('学历', dic_job[::-1], radius=['40%', '70%'],
)
.set_global_opts(
title_opts=opts.TitleOpts(
title="招聘岗位占比",
pos_left='center',
pos_top='center',
title_textstyle_opts=opts.TextStyleOpts(
color='#845ef7',
font_size=28,
font_weight='bold'
),
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
min_=50,
max_=400,
is_piecewise=False,
dimension=0,)
legend_opts=opts.LegendOpts(is_show=False, pos_top='5%'),
))
数据分析岗位的需求量最大,达到了35% 前端的岗位需求也达到了20%
爬虫岗位大概占比10%
大专学历,占比 33% 本科学历,占比 25%
经验不限/学历不限,占比 7%
pic_name = '福利词云.png'
stylecloud.gen_stylecloud(
text=' '.join(welfares_list),
font_path=r'STXINWEI.TTF',
palette='cartocolors.qualitative.Bold_5',
max_font_size=100,
icon_name='fas fa-yen-sign',
background_color='#212529',
output_name=pic_name, )
👉 公众号后台回复【可视化项目源码】获取更多可视化代码+数据
以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。
往期推荐
源码下载 | 【01-50】Pthon可视化系列文章资源(源码+数据)
可视化 | Flask+Mysql+Echarts 豆瓣电影Top250数据分析系统
53 | 基于Lasso回归和随机森林的上海链家二手房房价预测
52 | 基于KNN近邻和随机森林模型对用户转化进行分析与预测
Pandas+Pyecharts | 全国热门旅游景点数据分析可视化
可视化 | 分享一套Flask+Pyecharts可视化模板