Pandas+Pyecharts | 某直聘平台招聘信息数据可视化

科技科技 2024-12-16 08:10 天津

点击上方"蓝字"，关注"Python当打之年"

后台回复"1"，领取众多Python学习资料

大家好，我是欧K~

本期我们通过分析某招聘网站发布的python相关工作招聘信息数据，进行以下几个方面的分析：

全国哪些城市岗位数量比较多
哪些公司薪资待遇比较好
哪些岗位需求量比较大
普遍工资分布情况

涉及到的库：

Pandas — 数据处理

Pyecharts — 数据可视化

可视化部分：

柱状图 — Bar

饼状图 — Pie

地图 — Map

词云图 — stylecloud

1. 导入模块

2.Pandas数据处理

2.1 读取数据

2.2 查看索引、数据类型和内存信息

2.3 缺失值填充

2.4 列拆分

2.5 删除列

2.6 列重命名

2.7 薪资列处理（拆分、时薪、日薪转换）

3. Pyecharts数据可视化

3.1 招聘数量前20的城市柱状图

3.2 平均薪资前20的城市柱状图

3.3 最高薪资前十的公司柱状图（纵向）

3.4 各岗位占比饼图

3.5 经验学历要求占比饼图

3.6 招聘公司所在领域占比饼图

3.7 招聘城市分布地图

3.8 福利词云图

1. 导入模块

可视化部分需要用到 pyecharts==1.9.1。

# 导包
import re
import stylecloud
import pandas as pd
from PIL import Image
from pyecharts.charts import Bar
from pyecharts.charts import Map
from pyecharts.charts import Pie
from pyecharts import options as opts
from pyecharts.commons.utils import JsCode
from pyecharts.globals import SymbolType
from pyecharts.globals import ThemeType

2. Pandas数据处理

2.1 读取数据

df = pd.read_excel('boss岗位.xlsx')
df.head()

2.2 查看索引、数据类型和内存信息

df.info()

一共有2913条招聘信息，福利列存在部分缺失值。

2.3 缺失值填充

福利列用"无"填充：

df['福利'].fillna('无',inplace=True)
df.isnull().sum()

2.4 列拆分（地区列拆分为城市、城区、地址三列）

df1 = df.copy()
df1[['城市', '城区','地址']] = df1['地区'].str.split('·', 3, expand = True)
df1.head(3)

2.5 删除部分列

这里我们删除地区列和详情页列：

df1.drop(['地区','详情页'],axis=1, inplace=True)

2.6 列重命名

我们将标题重命名为岗位，公司名重命名为公司名称：

df1.rename(columns={"标题": "岗位", "公司名": "公司名称"},inplace=True)

2.7 薪资列处理（拆分、时薪、日薪转换）

薪资列将日薪和时薪转换为月薪：

3. Pyecharts可视化

3.1 招聘数量前20的城市柱状图

b1 = (
        Bar(init_opts=opts.InitOpts(theme=ThemeType.DARK,bg_color=JsCode(color_js1),width='1000px',height='600px'))
        .add_xaxis(x_data)
        .add_yaxis('',
                   y_data ,
                   category_gap="50%",
                  )
        .set_global_opts(
            title_opts=opts.TitleOpts(title='招 聘 数 量 前 20 的 城 市'),
            legend_opts=opts.LegendOpts(is_show=False),
            xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),
            yaxis_opts=opts.AxisOpts(name="",
                                     name_location='middle',
                                     name_gap=40,
                                     name_textstyle_opts=opts.TextStyleOpts(font_size=16)),
                         datazoom_opts=[opts.DataZoomOpts(range_start=1,range_end=50)]
                        )
    )

北京、上海、深圳等城市招聘数量位居三甲，杭州、广州、南京等城市次之。

3.2 平均薪资前20的城市柱状图

北京、深圳、上海等城市招聘数量位居前三，平均薪资也是前三。

3.3 最高薪资前十的公司柱状图（纵向）

华为、阿里巴巴、百度等企业平均薪资普遍较高。

3.4 各岗位占比饼图

pie = ( Pie(init_opts=opts.InitOpts(theme=ThemeType.DARK,width='1000px',height='600px'))

    .add('学历', dic_job[::-1], radius=['40%', '70%'],
        )
    .set_global_opts(
        title_opts=opts.TitleOpts(
            title="招聘岗位占比", 
            pos_left='center', 
            pos_top='center',
            title_textstyle_opts=opts.TextStyleOpts(
                color='#845ef7', 
                font_size=28, 
                font_weight='bold'
            ),
        ),
            visualmap_opts=opts.VisualMapOpts(
                is_show=False, 
                min_=50,
                max_=400,
                is_piecewise=False,
                dimension=0,)
            legend_opts=opts.LegendOpts(is_show=False, pos_top='5%'),
    ))

数据分析岗位的需求量最大，达到了35%
前端的岗位需求也达到了20%
爬虫岗位大概占比10%

3.5 经验学历要求占比饼图

大专学历，占比 33%
本科学历，占比 25%
经验不限/学历不限，占比 7%

3.6 招聘公司所在领域占比饼图

公司行领域中互联网和计算机服务行业，占比达到了 60% 。

3.7 招聘城市分布地图

3.8 福利词云图

pic_name = '福利词云.png'
stylecloud.gen_stylecloud(
    text=' '.join(welfares_list),
    font_path=r'STXINWEI.TTF',
    palette='cartocolors.qualitative.Bold_5',
    max_font_size=100,
    icon_name='fas fa-yen-sign',
    background_color='#212529',
    output_name=pic_name,    )

可以看出：五险一金（硬性规定）、带薪年假、节日福利、年终奖等是大家关注的核心问题。

4. 可视化源码

👉 公众号后台回复【可视化项目源码】获取更多可视化代码+数据

END

以上就是本期为大家整理的全部内容了，喜欢的朋友可以点赞、点在看也可以分享让更多人知道。

往期推荐

源码下载 | 【01-50】Pthon可视化系列文章资源(源码+数据)

爬虫 | Python爬取某平台杭州二手房数据

爬虫 | Python搞定软科中国大学排名

爬虫 | Python爬取胡润百富榜数据

爬虫 | Python爬取微博实时热搜榜信息

爬虫 | Python爬取B站榜排行榜信息

可视化 | Flask+Mysql+Echarts 豆瓣电影Top250数据分析系统

55 | 实习僧网Python岗位招聘数据分析可视化

54 | 2024年美国总统大选数据分析可视化

53 | 基于Lasso回归和随机森林的上海链家二手房房价预测

53 | 上海链家二手房数据分析可视化

52 | 基于KNN近邻和随机森林模型对用户转化进行分析与预测

51 | 深圳市共享单车数据分析可视化

01-50 | Pthon可视化系列文章资源(源码+数据)

Pandas+Pyecharts | 全国热门旅游景点数据分析可视化

可视化 | 再分享一套Flask+Pyecharts可视化模板二

可视化 | 分享一套Flask+Pyecharts可视化模板

可视化 | Python直观展示中国代表团冬奥会荣耀时刻

Matplotlib | 世界足球俱乐部排名可视化

点【在看】的您又变好看了呢

Python当打之年

当打之年，专注于各领域Python技术，量的积累，质的飞跃。后台回复：【可视化项目源码】可获取可视化系列文章源码和数据

最新文章

可视化大屏 | 2024年中国500强企业数据分析可视化大屏

【014-免费分享100套实用可视化大屏模板】

可视化大屏 | 交通事故数据分析可视化大屏

Pandas+Pyecharts | 交通事故数据分析可视化

【013-免费分享100套实用可视化大屏模板】

不止远程，超好用的远程访问工具首发初体验，值得期待

【012-免费分享100套实用可视化大屏模板】

可视化系统 | 微博舆情数据分析系统+数据库案例02（Flask+Mysql+Pyecharts）

Pandas+Pyecharts | 海南旅游攻略数据分析可视化

Pandas+Pyecharts | 杭州二手房数据分析可视化

Pandas+Pyecharts | 2024年中国500强企业数据分析可视化

Pandas+Pyecharts | 第七次人口普查数据分析可视化

Pandas+Pyecharts | 软科中国大学排名分析可视化

技巧 | Python制作朋友圈炫酷九宫格图片

Pandas+Pyecharts | 某直聘平台招聘信息数据可视化

可视化系统 | Flask+Pyecharts高校大数据可视化大屏系统案例

【010-免费分享100套实用可视化大屏模板】

爬虫 | Python爬取实习僧网岗位招聘数据

可视化大屏 | 实习僧网Python岗位招聘数据分析可视化大屏

Pandas+Pyecharts | 实习僧网Python岗位招聘数据分析可视化

【009-免费分享100套实用可视化大屏模板】

Pandas+Pyecharts | 2024年美国总统大选数据分析可视化

【01-50】Pthon可视化系列文章资源(源码+数据)

可视化 | Python绘制精美动态水球图

【01-50】Pthon可视化系列文章资源(源码+数据)

机器学习 | 基于Lasso回归和随机森林的上海链家二手房房价预测

Pandas+Pyecharts | 上海链家二手房数据分析可视化

Pandas+Pyecharts | 全国热门旅游景点数据分析可视化

Pandas+Pyecharts | 2024年巴黎奥运会奖牌数据分析可视化

Pandas+Pyecharts | 预热双十一，某平台美妆销售数据分析可视化

又来赠书啦 | ggplot2基于R语言的数据可视化

机器学习 | 基于KNN近邻和随机森林模型对用户转化进行分析与预测

可视化大屏 | 上海市餐饮数据分析可视化大屏(Flask版)

【008-免费分享100套实用可视化大屏模板】

【007-免费分享100套实用可视化大屏模板】

Pandas+Pyecharts | 深圳市共享单车数据分析可视化

可视化系统 | Flask+Pyecharts高校大数据可视化大屏系统案例一

【006-免费分享100套实用可视化大屏模板】

【005-免费分享100套实用可视化大屏模板】

工具分享 | 免费分享国庆节专属半透明五星红旗图像制作工具

技巧 | 分享100个Pandas常用基础指令

可视化大屏 | 某直聘平台招聘信息数据可视化大屏(普版+Flask版)

可视化大屏 | 中国大学综合排名分析可视化大屏(普版+Flask版)

可视化大屏 | 北京某平台二手房数据分析可视化（普版+Flask版）

可视化大屏 | 全国热门旅游景点数据分析可视化(普版+Flask版)

【免费分享100套实用可视化大屏模板-004】

可视化 | 近十年比特币价格走势动态时间序列分析

Pandas+Pyecharts | 暑期档电影票房数据分析可视化

Python实战系列 | 正则提取数据并绘图

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉