Python进行多输出(多因变量)回归:集成学习梯度提升决策树GRADIENT BOOSTING,GBR回归训练和预测可视化

科技   科技   2024-11-04 17:04   浙江  

原文链接:http://tecdat.cn/?p=25939

在之前的文章中,我们研究了许多使用 多输出回归分析的方法。在本教程中,我们将学习如何使用梯度提升决策树GRADIENT BOOSTING REGRESSOR拟合和预测多输出回归数据。对于给定的 x 输入数据,多输出数据包含多个目标标签。本教程涵盖:

  • 准备数据

  • 定义模型

  • 预测和可视化结果


我们将从加载本教程所需的库开始。

准备数据

首先,我们将为本教程创建一个多输出数据集。它是随机生成的数据,具有以下一些规则。该数据集中有三个输入和两个输出。我们将绘制生成的数据以直观地检查它。

f = plt.figure()
f.add_subplot(1,2,1)
plt.title("Xs 输入数据")
plt.plot(X)

接下来,我们将数据集拆分为训练和测试部分并检查数据形状。

print("xtrain:", xtrain.shape, "ytrian:", ytrain.shape)



点击标题查阅往期内容


R语言样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化


左右滑动查看更多


01

02

03

04




定义模型

我们将定义模型。作为估计,我们将使用默认参数实现。可以通过 print 命令查看模型的参数。

model = MutRer(es=gbr)
print(model )

现在,我们可以用训练数据拟合模型并检查训练结果。

fit(xtrain, ytrain)
score(xtrain, ytrain)

预测和可视化结果 

我们将使用经过训练的模型预测测试数据,并检查 y1 和 y2 输出的 MSE 率。

predict


最后,我们将在图中可视化结果并直观地检查它们。

xax = range(len)
plt.plot
plt.legend

在本教程中,我们简要学习了如何在 Python 中训练了多输出数据集和预测的测试数据。





本文中分析的数据、代码分享到会员群,扫描下面二维码即可加群! 



本文摘选Python进行多输出(多因变量)回归:集成学习梯度提升决策树GRADIENT BOOSTING REGRESSOR回归训练和预测可视化,点击“阅读原文”获取全文完整资料。





点击标题查阅往期内容

样条曲线、决策树、Adaboost、梯度提升(GBM)算法进行回归、分类和动态可视化
PYTHON集成学习:自己编写构建ADABOOST分类模型可视化决策边界及SKLEARN包调用比较
PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像
PYTHON集成机器学习:用ADABOOST、决策树、逻辑回归集成模型分类和回归和网格搜索超参数优化
R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序列数据
Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言基于树的方法:决策树,随机森林,Bagging,增强树
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
spss modeler用决策树神经网络预测ST的股票
R语言中使用线性模型、回归决策树自动组合特征因子水平
R语言中自编基尼系数的CART回归决策树的实现
R语言用rle,svm和rpart决策树进行时间序列预测
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
python中使用scikit-learn和pandas决策树进行iris鸢尾花数据分类建模和交叉验证
R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类
R语言ISLR工资数据进行多项式回归和样条回归分析
R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
R语言用泊松Poisson回归、GAM样条曲线模型预测骑自行车者的数量
R语言分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测


欲获取全文文件,请点击左下角“阅读原文”。



拓端数据部落
拓端(tecdat.cn)创立于2016年,提供专业的数据分析与挖掘服务,致力于充分挖掘数据价值。
 最新文章