本期我们利用Python分析「交通事故数据集」,看看:交通事故时间分布、事故车辆颜色分布、最多交通事故起因、各事故责任划分占比、驾驶员性别占比、驾驶员驾龄占比、事故车辆品牌分布等等,希望对大家有所帮助,如有疑问或者需要改进的地方可以联系小编。
上期:Pandas+Pyecharts | 交通事故数据分析可视化
涉及到的库:
Pandas — 数据处理
Pyecharts — 数据可视化
import pandas as pd
from pyecharts.charts import *
from pyecharts.commons.utils import JsCode
from pyecharts import options as opts
import warnings
warnings.filterwarnings('ignore')
2.1 读取数据
df = pd.read_excel('./交通事故数据集.xlsx')
2.2 查看数据信息
df.info()
一共有36000+条数据 包含事故时间、地点、起因、责任划分、驾驶员性别、车牌、车辆颜色、车辆品牌等字段
2.3 去除重复数据
df1 = df.drop_duplicates()
2.4 去除空数据
df1 = df1.dropna()
2.5 时间数据处理
df1['事故时间_年'] = df1['时间_td'].dt.year
df1['事故时间_月'] = df1['时间_td'].dt.month
df1['事故时间_日'] = df1['时间_td'].dt.day
df1['事故时间_时'] = df1['时间_td'].dt.hour
以上就是本期为大家整理的全部内容了,喜欢的朋友可以点赞、点在看也可以分享让更多人知道。
往期推荐
源码下载 | 【01-50】Pthon可视化系列文章资源(源码+数据)
可视化 | Flask+Mysql+Echarts 豆瓣电影Top250数据分析系统
56 | 2024年中国500强企业数据分析可视化
53 | 基于Lasso回归和随机森林的上海链家二手房房价预测
52 | 基于KNN近邻和随机森林模型对用户转化进行分析与预测
Pandas+Pyecharts | 全国热门旅游景点数据分析可视化
可视化 | 分享一套Flask+Pyecharts可视化模板