数据探索分析——双十一美妆数据分析

文摘 2024-10-07 12:52 上海

matplotlib+pandas+jupyter-notebook

基于Python+matplotlib+pandas+jupyter-notebook的数据探索分析第一弹

数据分析

数据为天猫双十一女性美妆的数据集，围绕产品及其销量和评论撰写。数据具有7个特征，可以从多个维度解析文本。由于是真实的商业数据，所以做了匿名处理，数据集中对店名的引用被处理为产品的品牌名以保护店家隐私。

数据处理

首先，使用Pandas库加载CSV文件，使用Pandas提供的函数查看数据的前几行和数据结构信息，对要分析的总体数据进行概览。

查看数据

查看数据表的基本信息，快速了解数据表的基本结构，包括每列的数据类型、非空值计数以及内存使用情况。

统计店铺记录数

统计数据集中每个店铺的记录数量，查看每个店铺在数据集中出现的次数，从而了解不同化妆品品牌的销售数据量。

数据清洗

对数据进行清洗，处理重复数据并重置索引，确保数据的唯一性和索引的连续性。

处理缺失值

对数据集中的缺失值进行处理，检查数据集中是否存在缺失值，并进行相应的填充。

提取表格中有用信息并新增为列

对标题进行分词，给商品添加分类，比如：将“乳液”分为“护肤品-乳液类”，“眼霜”分为“护肤品-眼部护理”等。通过这一步骤，完成对美妆产品销售数据的清理和准备工作：从数据清洗、分类标签的添加、判断是否男士专用、销售额计算、日期处理到数据格式的保存，为后续的数据分析和建模提供了规整的数据结构和准备好的数据文件。

安装与使用

本项目在python3.8下通过测试，具体可以查看requirements中的环境要求，在这里出一个简单的项目使用教程，一般项目中的requirements.txt中包含了项目的python依赖环境，在安装好python的前提下只需要在cmd窗口中pip install -r requirements.txt 有时候因为路径问题会提示requirements这个文件不存在，可以改为完整的路径，比如c:\requirements.txt,对于本项目只需要运行python manage.py runserver，在pycharm的配置更为方便，可以不用每次都在终端输入命令使用。

获取方式

有需要的小伙伴可以通过后台联系方式获取，如果加不上可以后台留言留下联系方式，不经常看后台，但是看到了会回复的~，源码获取只收取很少的钱钱，除非是标记了For Free的。

http://mp.weixin.qq.com/s?__biz=Mzg2MDA2MjA3Ng==&mid=2247486711&idx=1&sn=ef9a529de44c6dbf2720b720a1a39543

Python工坊

Python技术分享

最新文章

基于Python+Django+TensorFlow的异常企业识别平台

基于Flask+MySQL+HTML的微博舆情可视化分析系统

基于Python+Django+MySQL+Tensorflow的车牌检测识别系统

基于Python+Django+MySQL+Vue的大学生竞赛展示平台

基于Python+Django+MySQL+HTML的创新创业平台

基于Python+Django+MySQL+Vue的人力资源管理系统

基于Python+Django+MySQL+Vue的二手书籍交易系统

基于Python+Django+MySQL+Vue的医疗知识问答系统

基于Python+Flask+MySQL+HTML的房价信息预测可视化分析系统

基于Python+Flask+MySQL+HTML的视频数据分析系统

基于Python+Django+MySQL+Vue的图书借阅系统

数据探索分析——双十一美妆数据分析第二篇

基于Python+PyQt5+opencv的手势识别系统

数据探索分析——双十一美妆数据分析

基于Python+Django+MySQL+Vue的大学生竞赛展示平台

基于Python+Django+MySQL+Vue的电影购票系统

基于Python+Flask+Vue的垃圾邮件识别系统

基于Python+Django+MySQL+Vue的大学生竞赛展示平台

基于Python+Django+TensorFlow的异常企业识别平台

基于Python+Django+MySQL+Vue的电影购票系统

基于Python+Django+MySQL+Vue的文献检索系统

基于Python+MySql+Flask+Vue的电脑运维管理系统

Nuitka打包制作exe桌面软件

基于Python+Flask+MySQL+Vue的失业保险人员信息管理系统系统

基于Python+PyQt5+PyTorch的电瓶车检测识别系统

基于Python+Flask+MySQL的在线音乐网站

基于Python+Flask+MySQL的在线商城

基于Pygame的游戏

基于Python+PyQt5的Word助手小工具

基于Python+PyQt5的Excel助手小工具

基于Python+Flask+MySQL+Vue的失业保险人员信息管理系统系统

基于TK的医院信息管理系统

基于Python+Django+MySQL+Vue的学生信息管理系统

基于Pygame的游戏

基于Python+Django+MySQL的车辆管理系统

Python基于Django+SQLite+Leaflet的地图展示与交互Forfree

电影管理系统ForFree

基于Python+PyQt5+MySQL+Requests的笔记本信息爬虫可视化系统

基于Python+Django+MySQL+Tensorflow的车牌检测识别系统

基于Python+Django+MySQL+Vue的消费者投诉数据可视化分析系统

基于Python+Django+MySQL+Vue的短剧视频分析系统

基于Python+Flask+MySQL的后台权限管理系统

基于Python+Flask+MySQL+HTML的商品数据可视化分析系统

基于Python+PyQt5+MySQL+Requests的笔记本信息爬虫可视化系统

Python+Echart+Requests+Selenium的粽子商品爬虫可视化系统

基于Python+Flask+SQLite的豆瓣电影可视化系统

基于Python+Django+MySQL+Vue的校园二手交易网站

基于Python+Django+MySQL的医学博客

基于Python+Django+MySQL+Vue的电子产品信息查询可视化系统

基于Python+Django+MySQL+Vue的消费者投诉数据可视化分析系统

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉