基于Python+pyecharts 实现国内上映电影票房评分可视化分析项目源码

科技科技 2023-12-03 12:00 云南

基于Python+pyecharts 实现国内上映电影票房评分可视化分析项目源码

项目内容

统计2018年在国内上映的所有电影，分别获取上映电影的票房、评分（豆瓣、猫眼、时光、imdb）、类型、上映日期、演员、导演等数据。利用所获数据绘图，对国内上映电影进行定量分析

项目思路

通过中国票房网获得2018年大陆上映电影和每部电影票房数据
根据已有的票房数据，通过豆瓣 api 和详细页面，获得每部电影的导演，演员和豆瓣评分等详细数据
分别通过猫眼、时光网和 imdb，获取这三个网站的电影评分数据
新建影人条目，利用豆瓣获得的影人数据，对2018年每个演员年参演电影进行统计
根据已有数据作图，分析2018年电影票房排名、不同网站评分差异、电影票房-评分关系等

运行环境

Python 3.6
linux/windows
jupyter notebook

运行依赖包

requests
bs4
pymongo
numpy
pyecharts

文件说明

movies_data 文件夹: 包括了所有获取数据所需的 .py 文件

step0_chinamovies.py：获取中国票房网2018年所有国内上映电影及票房
step1_doubanmovies.py：根据中国票房网得到的电影数据，从豆瓣 api 接口中获得更详细的数据并存入数据库
step1_doubanmovies_supplement.py：用来寻找在 step1_doubanmovies.py 中由于名称原因没有找到的电影
step2_moviedetail.py：获得每部电影在不同网站的评分、演职人员等详细信息
step3_celebrity.py：计算每个影人（导演）2018年参（导）演电影的票房总和

movie_draws 文件夹

为了更加直观的进行展示，数据分析和绘图的代码写在了 jupyter notebook 里面
采用 pyecharts 绘图，包括“电影评分-票房”等八张图
movie_pyecharts.ipynb
包括了HTML格式的所有 movie_pyecharts.ipynb 绘制图

output_data 文件夹

data_output.py: 从数据库导出电影和影人数据的 .py 文件
movie_data.csv: 抓取的2018年所有电影条目，共 522 部
cast_data.csv: 每个影人2018年参演电影及电影票房总和排名，共 4723 影人

一些技术细节

由于要更改数据库，所有获取数据并保存数据库的操作都写成了函数形式，执行函数的代码加了注释，可根据自身需要去掉注释运行代码
数据保存：数据采用mongodb保存，使用时需要安装 pymongo 第三方库

连接到数据表

client = pymongo.MongoClient()
db = client.chinamovies # 连接到数据库
collections = db.movies # 数据表 movies
collections_detail = db.moviesdetail # 豆瓣数据都放入了数据表 moviesdetail 中

写入多条数据
collections.insert_many(data['pData'])
写入一条数据
collections_detail.insert_one(datadetail)

更新数据

# 更新数据到数据库中
collections_detail.update({'_id': i['_id']}, {'$set': {'猫眼':{
    'title': movie['nm'], 'rank': movie['sc'],
    'id': movie['id'], 'pubDesc': movie['pubDesc']
}}})

数据验证

本项目中，由于涉及多个网站的电影数据，因此会发生网站A 电影上映日期或名称与网站B 不同的情况。本项目中，电影上映日期和名称均以豆瓣网为准。利用网站A 的电影名在网站B 中进行搜索时，必须要保证电影名和上映年份完全一致，对于电影名不符合的电影，需要进行二次的人工判断

例：

# 必须要名称一致且2018年大陆上映才符合要求
if movie['nm'] == i['title'] and re.findall(r'2018.*大陆上映', movie['pubDesc']):
    ... # 符合要求

绘图：利用 pyecharts 绘图，pyecharts 使用可见官方文档：http://pyecharts.org/

所有图表

完整项目代码下载地址：

https://download.csdn.net/download/yanglamei1962/88482167

http://mp.weixin.qq.com/s?__biz=MzA5MzQ5NDM0OQ==&mid=2647584655&idx=1&sn=2bd9497b60305cd166e3541dde9c2910

Python代码大全

Python源程序、源代码、源码分享，Python代码大全，Python源代码学习，Python入门，Python基础教程。

用python画红星红旗、国旗代码，国庆节代码

基于jupyter notebook + joint-spider爬虫数据的成都二手房数据可视化分析项目源代码+详细使用说明

Python中秋赏月专用代码中秋节代码

基于Android studio的五子棋源代码+后台+数据库，安卓课程大作业+使用教程

无敌了！强烈建议今年拿下软考

人机交互项目基于openCV的手势识别控制的打地鼠游戏源代码+数据+项目报告+演示视频，代码有详细注释

基于SpringBoot的学生成绩可视化分析系统源代码+数据库，学生成绩管理，考试发布，可视化数据分析，辅助教学，提高教学质量

Python基于深度学习的人脸识别项目源码+演示视频，利用OpenCV进行人脸检测与识别

Python基于PyQt5制作的一个上位机软件，用来控制一个Arduino四自由度机械臂

基于Python实现的快递管理系统源码+数据库，采用PyQt6实现GUI界面

基于深度学习的数据污染检测系统源码+使用说明书

毕业设计基于opencv图像识别的笔迹识别系统源码+详细项目文档

程序设计思维课程大作业用python flask实现的网页版python编辑器项目源码，用CodeMirror来实现代码高亮

基于flask和echarts的新冠疫情实时监控系统源码+数据库，后端基于python的flask框架，前端主要是echarts

Python实现多元线性回归模型信用卡客户价值预测项目源码+数据+项目设计报告

基于Django框架实现的图像相似性搜索网页应用项目源码+数据库，上传图片到网站，基于预训练的 VGG16 模型提取图像特征

基于Python实现的一个书法字体风格识别器源码，通过输入图片，识别出图片中的书法字体风格，采用Tkinter实现GUI界面

基于Tkinter和OpenCV的目标检测程序源码+权重文件，实现摄像头和视频文件的实时目标检测采用YOLOv8模型进行目标检测

Pyhon基于YOLOV实现的车辆品牌及型号检测项目源码+模型+项目文档

网页版圣诞节贺卡源码超漂亮HTML版圣诞节贺卡送女朋友圣诞节贺卡源码

基于opencv和tensorflow实现人脸识别项目源码+可执行文件，采用python中的tkinter库做可视化

基于Python+pyecharts 实现国内上映电影票房评分可视化分析项目源码

Python基于机器学习模型LightGBM进行水电站入库流量预测项目源码+数据集+模型，含项目报告

基于Python实现的一个命令行文本计数统计程序，可统计纯英文txt文本中的字符数，单词数，句子数，Python文件行数

基于flask+bootstrap4实现的注重创作的轻博客系统项目源码

基于Python + MQTT实现的的聊天室项目源码+数据库，实现登录、注册、多个聊天室切换，保存以往聊天记录

基于Python实现的一款轻量、强大、好用的视频处理软件，可缩视频、转码视频、倒放视频、合并片段、根据字幕裁切片段、自动配字幕等

基于Python实现的一个通用的二进制数据分析工具源码，分析任意格式的二进制数据，还能同时查看协议文档

基于Python实现的快递管理系统源码+数据库，采用PyQt6实现GUI界面

（待会删）yyds！疯传全网的AI资源，请低调使用！

用python画红星红旗、国旗代码，国庆节代码

Python中秋赏月专用代码中秋节代码

中秋祝福代码，中秋快乐代码，采用H5制作的中秋动画祝福

Python代码大全，海量代码任你下载

免费学Python大课！抢完我就被开除了

基于Django框架搭建的机器学习在线平台源代码+数据库，实现KNN、ID3、SVM、朴素贝叶斯、BP神经网络等算法及流程管理

基于OpenCV+Keras实现的变电站作业管控平台源代码。含人脸识别考勤，移动目标跟踪，越线检测，安全措施检测，姿态识别等功能

Python代码大全，海量代码任你下载

Python版打字练习软件源代码，键盘练习软件源代码，含娱乐模式和训练模式

Python版儿童识字游戏源代码，结合植物大战僵尸和儿童识字的小游戏，含学习模式和娱乐模式

Python儿童数字消消乐游戏源代码，小朋友认数字游戏源代码

Python实现的空灵鼓模拟器源代码，可定制曲谱，简单易学

Python实现的儿童数数字游戏源代码，数出屏幕里出现的水果个数，并选择对应的数字

Python版经典小游戏愤怒的小鸟源代码，基于pygame+pymunk

C语言版桌球游戏台球游戏源代码，含完整程序设计文档及答辩PPT，含可执行文件

Python版基于pygame的玛丽快跑小游戏源代码，玛丽冒险小游戏代码，支持双人模式

基于Django的企业信息管理系统源代码，客户关系管理系统源代码

基于Python+Django的谣言检测系统源代码，返回谣言命中的参考依据，计算谣言的可能性可能性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉