Python实现多元线性回归模型信用卡客户价值预测项目源码+数据+项目设计报告

科技科技 2024-01-14 10:24 云南

多元线性回归——信用卡客户价值预测

一、背景

这里以信用卡客户的客户价值为例来解释客户价值预测的具体含义：

客户价值预测就是指预测客户在未来一段时间内能带来多少利润，其利润可能来自信用卡的年费、取现手续费、分期手续费、境外交易手续费等。分析出客户价值后，在进行营销、电话接听、催收、产品咨询等各项业务时，就可以针对高价值客户提供区别于普通客户的服务，以进一步挖掘这些高价值客户的价值，并提高他们的忠诚度。

二、数据

“客户价值”列为在1年里能给银行带来的收益；
“学历”列的数据已经做了预处理，其中

2代表高中及以下学历
3代表本科及以上学历

“性别”列中，0 代表女，1 代表男

部分数据如下：

客户价值	历史贷款金额	贷款次数	学历	月收入	性别
1096	6253	2	2	10567	0
1558	4779	3	2	10217	1
1681	7752	3	3	10317	1
1037	5231	3	2	9667	1
1333	5485	2	3	10567	0

三、代码实现

1、导入Python库,引入所需的功能和模块。

import matplotlib.pyplot as plt  # 用于绘制数据可视化图形，例如折线图、散点图等import pandas as pd  # 用于数据处理和分析，提供了高效的数据结构和数据操作功能import statsmodels.api as sm  # 用于执行统计模型的拟合和推断，包括回归分析、时间序列分析等from sklearn.linear_model import LinearRegression  # 用于进行线性回归建模和预测from sklearn.model_selection import train_test_split  # 将数据集

分割为训练集和测试集，常用于机器学习中的模型评估和验证

2、读取数据

data = pd.read_excel(file_path)  # 使用pd.read_excel()函数读取名为'客户价值数据表.xlsx'的Excel文件，并将其存储在data变量中    # 根据指定的测试集比例（这里是20%）将数据分割为训练集和测试集，并且设置了一个随机种子（这里是42）以确保结果可复现    train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)    X = data[['历史贷款金额', '贷款次数', '学历', '月收入', '性别']]  # 从data中选取'历史贷款金额'、'贷款次数'、'学历'、'月收入'、'性别'这几列作为自变量，并将其存储在X变量中    Y = data['客户价值']  # 从data中选取'客户价值'这一列作为因变量，并将其存储在Y变量中    X_test = test_data[['历史贷款金额', '贷款次数', '学历', '月收入', '性别']]    Y_test = test_data['客户价值']

3、搭建多元线性回归模型

 Regress = LinearRegression()  # 创建一个LinearRegression对象，并将其存储在Regress变量中    Regress.fit(X, Y)  # 使用X和Y进行线性回归拟合，得到回归模型    Predict = Regress.predict(X)  # 对五个特征变量进行回归预测
    # 2.1绘制真实值和与预测值的散点图形    plt.scatter(Y, Predict)
    # 2.2设置图例    plt.xlabel('Actual Value')    plt.ylabel('Predicted Value')    plt.title('Regression Graph')    plt.show()  # 显示

真实值和与预测值的散点图形

添加一条拟合线

  plt.plot([Y.min(), Y.max()], [Y.min(), Y.max()], 'r-')

4、构造多元线性回归方程表达式

 K = Regress.coef_    b = Regress.intercept_    print('各斜率系数为:\n', str(K))  # 打印输出回归模型的各系数值    print('常数项系数k0（截距）为:\n', str(b))  # 打印输出回归模型的常数项系数k0    expression = construct_expression(K, b)  # 计算多元线性回归方程函数表达式    print("多元线性回归方程为：\n", expression)

各斜率系数为:
[5.71421731e-02 9.61723492e+01 1.13452022e+02 5.61326459e-02 1.97874093e+00]

常数项系数k0（截距）为:
-208.42004079958429

多元线性回归方程为：
Y = -208 + 0.057X1 + 96X2 + 113X3 + 0.056X4 + 1.98X5

5、模型评估

 X1 = sm.add_constant(X)  # 在X变量中添加常数列，并将新的X变量存储在X1中    est = sm.OLS(Y, X1).fit()  # 使用OLS方法进行普通最小二乘回归拟合，得到回归模型的估计值，将结果存储在est变量中    print('\n\n回归模型的统计摘要信息如下:\n', est.summary())  #

输出回归模型的统计摘要信息

运行输出如下：可以看到，模型的R-squared值为0.571，Adj.R-squared值为0.553，整体拟合效果不是特别好，可能是因为本案例的数据量偏少，不过在此数据量条件下也算可以接受的结果。再来观察P值，可以发现大部分特征变量的P值都较小，的确与目标变量（即“客户价值”）显著相关，而“性别”这一特征变量的P值达到了0.951，即与目标变量没有显著相关性，这个结论也符合经验认知，因此，在之后的建模中可以舍去“性别”这一特征变量

6、模型预测

predict_new_data(Regress, X_test, Y_test)

运行输出如下：

真实值与预测值对比图

7、相关函数

# 构造函数表达式# 表达式中的系数值在-1到1之间的要保留三位小数，系数值在-10到-1以及1到10之间的要保留两位小数，其余保留整数def construct_expression(K, b):    expression = f"Y = {int(b)}"    for i, coef in enumerate(K):        if -10 <= coef <= -1 or 1 <= coef <= 10:            expression += f" + {coef:.2f}*X{i + 1}"        elif -1 <= coef <= 1:            expression += f" + {coef:.3f}*X{i + 1}"        else:            expression += f" + {int(coef)}*X{i + 1}"    return expression

# 模型预测def predict_new_data(model, X_new, Y_new):    print("\n\n\n\n模型预测使用的数据如下：\n", X_new)    new_prediction = model.predict(X_new)    print('模型预测数据的预测结果:\n', new_prediction)    # 绘制真实值与预测值对比图    plt.plot(Y_new['客户价值'].tolist(), label='Actual Value')    plt.plot(new_prediction, label='Predicted Value')    plt.xlabel('Sample Index')    plt.ylabel('Value')    plt.title('Regression Curve Comparison')    plt.legend()    plt.show()

8、程序入口

# 程序入口if __name__ == '__main__':    path = '客户价值数据表.xlsx'    multiple_linear_regression(path)  # 调用函数并传入数据文件的路径

完整代码下载地址：

https://download.csdn.net/download/shiyunzhe2021/88647460

http://mp.weixin.qq.com/s?__biz=MzA5MzQ5NDM0OQ==&mid=2647584901&idx=1&sn=d8d51365c70c5b71edc7cca889a4ed61

Python代码大全

Python源程序、源代码、源码分享，Python代码大全，Python源代码学习，Python入门，Python基础教程。

用python画红星红旗、国旗代码，国庆节代码

基于jupyter notebook + joint-spider爬虫数据的成都二手房数据可视化分析项目源代码+详细使用说明

Python中秋赏月专用代码中秋节代码

基于Android studio的五子棋源代码+后台+数据库，安卓课程大作业+使用教程

无敌了！强烈建议今年拿下软考

人机交互项目基于openCV的手势识别控制的打地鼠游戏源代码+数据+项目报告+演示视频，代码有详细注释

基于SpringBoot的学生成绩可视化分析系统源代码+数据库，学生成绩管理，考试发布，可视化数据分析，辅助教学，提高教学质量

Python基于深度学习的人脸识别项目源码+演示视频，利用OpenCV进行人脸检测与识别

Python基于PyQt5制作的一个上位机软件，用来控制一个Arduino四自由度机械臂

基于Python实现的快递管理系统源码+数据库，采用PyQt6实现GUI界面

基于深度学习的数据污染检测系统源码+使用说明书

毕业设计基于opencv图像识别的笔迹识别系统源码+详细项目文档

程序设计思维课程大作业用python flask实现的网页版python编辑器项目源码，用CodeMirror来实现代码高亮

基于flask和echarts的新冠疫情实时监控系统源码+数据库，后端基于python的flask框架，前端主要是echarts

Python实现多元线性回归模型信用卡客户价值预测项目源码+数据+项目设计报告

基于Django框架实现的图像相似性搜索网页应用项目源码+数据库，上传图片到网站，基于预训练的 VGG16 模型提取图像特征

基于Python实现的一个书法字体风格识别器源码，通过输入图片，识别出图片中的书法字体风格，采用Tkinter实现GUI界面

基于Tkinter和OpenCV的目标检测程序源码+权重文件，实现摄像头和视频文件的实时目标检测采用YOLOv8模型进行目标检测

Pyhon基于YOLOV实现的车辆品牌及型号检测项目源码+模型+项目文档

网页版圣诞节贺卡源码超漂亮HTML版圣诞节贺卡送女朋友圣诞节贺卡源码

基于opencv和tensorflow实现人脸识别项目源码+可执行文件，采用python中的tkinter库做可视化

基于Python+pyecharts 实现国内上映电影票房评分可视化分析项目源码

Python基于机器学习模型LightGBM进行水电站入库流量预测项目源码+数据集+模型，含项目报告

基于Python实现的一个命令行文本计数统计程序，可统计纯英文txt文本中的字符数，单词数，句子数，Python文件行数

基于flask+bootstrap4实现的注重创作的轻博客系统项目源码

基于Python + MQTT实现的的聊天室项目源码+数据库，实现登录、注册、多个聊天室切换，保存以往聊天记录

基于Python实现的一款轻量、强大、好用的视频处理软件，可缩视频、转码视频、倒放视频、合并片段、根据字幕裁切片段、自动配字幕等

基于Python实现的一个通用的二进制数据分析工具源码，分析任意格式的二进制数据，还能同时查看协议文档

基于Python实现的快递管理系统源码+数据库，采用PyQt6实现GUI界面

（待会删）yyds！疯传全网的AI资源，请低调使用！

用python画红星红旗、国旗代码，国庆节代码

Python中秋赏月专用代码中秋节代码

中秋祝福代码，中秋快乐代码，采用H5制作的中秋动画祝福

Python代码大全，海量代码任你下载

免费学Python大课！抢完我就被开除了

基于Django框架搭建的机器学习在线平台源代码+数据库，实现KNN、ID3、SVM、朴素贝叶斯、BP神经网络等算法及流程管理

基于OpenCV+Keras实现的变电站作业管控平台源代码。含人脸识别考勤，移动目标跟踪，越线检测，安全措施检测，姿态识别等功能

Python代码大全，海量代码任你下载

Python版打字练习软件源代码，键盘练习软件源代码，含娱乐模式和训练模式

Python版儿童识字游戏源代码，结合植物大战僵尸和儿童识字的小游戏，含学习模式和娱乐模式

Python儿童数字消消乐游戏源代码，小朋友认数字游戏源代码

Python实现的空灵鼓模拟器源代码，可定制曲谱，简单易学

Python实现的儿童数数字游戏源代码，数出屏幕里出现的水果个数，并选择对应的数字

Python版经典小游戏愤怒的小鸟源代码，基于pygame+pymunk

C语言版桌球游戏台球游戏源代码，含完整程序设计文档及答辩PPT，含可执行文件

Python版基于pygame的玛丽快跑小游戏源代码，玛丽冒险小游戏代码，支持双人模式

基于Django的企业信息管理系统源代码，客户关系管理系统源代码

基于Python+Django的谣言检测系统源代码，返回谣言命中的参考依据，计算谣言的可能性可能性

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉