本期将利用Python分析「实习僧网站招聘数据」,看看:各城市python岗位实习生招聘数量,招聘平均薪资分布,招聘岗位分布,招聘学历要求、实习周期分布等情况,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
【下期:实习僧网站岗位数据爬虫】
涉及到的库:
Pandas — 数据处理
Pyecharts — 数据可视化
import pandas as pd
from pyecharts.charts import *
from pyecharts.commons.utils import JsCode
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
2.1 读取数据
df = pd.read_excel('./实习僧招聘数据.xlsx')
2.2 查看数据信息
df.info()
一共有600条数据 包含岗位名称、公司、城市、学历、福利、薪资、工作周期、实习时间等字段
2.3 去除重复数据
df1 = df.drop_duplicates()
2.4 调整部分城市名称
df['城市'] = df['城市'].replace({'上海市':'上海','成都市':'成都','武汉市':'武汉','北京市':'北京','深圳市':'深圳'})
def get_bar1():
chart = (
Bar()
.add_xaxis(x_data)
.add_yaxis('', y_data,label_opts=opts.LabelOpts(position='right'))
.set_global_opts(
title_opts=opts.TitleOpts(
title="1-招聘数量前20岗位",
pos_left="center",
pos_top='2%',
subtitle=subtitle,
),
visualmap_opts=opts.VisualMapOpts(
is_show=True,
),
) )
的招聘数量前20的岗位主要是:后端开发、算法、软件开发、后端开发工程师、深度学习算法、NLP算法、后端、算法工程师、机器学习、视觉算法、python开发、后端研发、软件工程师、软件开发工程师、语音算法、NLP、Python开发、AI算法、大模型算法、图像算法等,主要以后端算法为主。
招聘地点主要集中在:北京、上海、深圳、杭州、成都、南京、广州、苏州、武汉等城市。
def get_pictorialBar():
chart = (
PictorialBar()
.add_xaxis(x_data)
.add_yaxis(
"",
y_data,
label_opts=opts.LabelOpts(is_show=False),
symbol_size=12,
symbol_repeat="fixed",
symbol_offset=[0, 0],
is_symbol_clip=True,
)
.set_global_opts(
title_opts=opts.TitleOpts(
title='3-各城市平均薪资象形图',
pos_left="center",
pos_top='2%',
subtitle=subtitle,
),
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=90)),
visualmap_opts=opts.VisualMapOpts(
is_show=True,
),
)
)
上海、北京、深圳、杭州等地的平均薪资相较于其他城市更高一些。
招聘学历方面主要以本科、硕士为主,占比超过80%。
3.5 实习薪资分布
def get_scatter():
chart = (
Scatter()
.add_xaxis(x_data)
.add_yaxis(
"",
y_data,
label_opts=opts.LabelOpts(is_show=False),
)
.set_global_opts(
title_opts=opts.TitleOpts(
title="5-实习薪资分布",
pos_left="center",
pos_top='2%',
subtitle=subtitle,
),
xaxis_opts=opts.AxisOpts(name='id'),
yaxis_opts=opts.AxisOpts(name='元/天'),
visualmap_opts=opts.VisualMapOpts(
is_show=True,
),
) )
实习期间薪资基本上集中在100-400元/天这个区间。
实习时间上大部分公司要求实习3-6个月,以3个月居多,也存在实习期1个月和1年的情况。
def get_scatter():
chart = (
Pie()
.add("",
[list(z) for z in zip(x_data, y_data)],
center=['50%','55%'],
)
.set_global_opts(
title_opts=opts.TitleOpts(
title="8-实习工作周期",
pos_left="center",
pos_top='2%',
subtitle=subtitle,
),
visualmap_opts=opts.VisualMapOpts(
is_show=True,
),
) )
实习工作周期以5天/周为主,占比接近65%。
def get_WordCloud():
chart = (
WordCloud(init_opts=init_opts)
.add('',words,word_size_range=[5,34])
.set_global_opts(
title_opts=opts.TitleOpts(
title='9-公司词云',
subtitle=subtitle,
pos_top='2%',
pos_left='center',
),
visualmap_opts=opts.VisualMapOpts(
is_show=False,
),
) )
https://www.heywhale.com/home/column/60e2740e3aeb9c0017b967a2
👉 公众号后台回复【可视化项目源码】获取更多可视化代码+数据
以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。
往期推荐
可视化 | Flask+Mysql+Echarts 豆瓣电影Top250数据分析系统
机器学习 | 基于Lasso回归和随机森林的上海链家二手房房价预测
机器学习 | 基于KNN近邻和随机森林模型对用户转化进行分析与预测
Pandas+Pyecharts | 全国热门旅游景点数据分析可视化
Pandas+Pyecharts | 深圳市共享单车数据分析可视化
Pandas+Pyecharts | 暑期档电影票房数据分析可视化
Pandas+Pyecharts | 平均预期寿命数据可视化
Pandas+Pyecharts | 杭州二手房数据分析可视化
Pandas+Pyecharts | 当当网畅销图书榜单数据分析可视化
Pandas+Pyecharts | 海南旅游攻略数据分析可视化
Pandas+Pyecharts | 全国海底捞门店数据分析可视化
Pandas+Pyecharts | 京东某商品销量数据分析可视化
Pandas+Pyecharts | 第七次人口普查数据分析可视化
Pandas+Pyecharts | 快手APP全国大学生用户数据分析可视化
Pandas+Pyecharts | 奥迪汽车销量数据分析可视化
Pandas+Pyecharts | 剧荒了?用Python找找最近的热播好剧!
Pandas+Pyecharts | 2023年胡润百富榜数据分析可视化
Pandas+Pyecharts | 成都大运会奖牌数据分析可视化
Pandas+Pyecharts | 电子产品销售数据分析可视化+用户RFM画像
Pandas+Pyecharts | 北京近五年历史天气数据可视化
Pandas+Pyecharts | 中国高校及专业数据分析可视化
Pandas+Pyecharts | 新冠疫情数据动态时序可视化
Pandas+Pyecharts | 全国吃穿住行消费排行榜,最‘抠门’的地区居然是北京!!!
Pandas+Pyecharts | 2022世界500强数据分析可视化
Pandas+Pyecharts | 上海市餐饮数据分析可视化
Pandas+Pyecharts | 山东省高考考生数据分析可视化
Pandas+Pyecharts | 20000+天猫订单数据可视化
Pandas+Pyecharts | 40000+汽车之家数据分析可视化
Pandas+Pyecharts | 广州市已成交房源信息数据可视化
Pandas+Pyecharts | 某直聘平台招聘信息数据可视化
可视化 | 分享一套Flask+Pyecharts可视化模板
用Python分析了3W+《独行月球》影评数据,看看观众们怎么说~