Matlab决策树对空气质量和天气温度及天气数据做交通出行推荐预测|数据分享

科技   科技   2024-11-15 19:03   浙江  

全文链接:http://tecdat.cn/?p=31784


为解决城市交通拥堵问题,本文提出了一种基于 Matlab决策树的交通预测方法,我们通过采集上海地区的空气质量数据和温度数据,帮助客户在 Matlab中实现决策树建模,利用所提取的天气和温度特征建立决策树,对未来的出行时间、出行路线等进行预测点击文末“阅读原文”获取完整代码数据

相关视频


结果表明:该方法可实现交通时间、出行路线的预测,并能在未来三天进行有效预测时间长度与空气质量、温度相关。

数据

里面一个是天气数据(区县自动站实况数据),只把地区为徐家汇的取出来,其余地点的不用参考。

另一个是空气数据(实时空气质量数据)。

预期结果

根据空气中的空气质量和天气数据中的温度及天气情况做一个交通出行的推荐。

举个例子:今天温度0度 天气晴朗 空气质量优 出行方式可以为 公交车或地铁。

今天温度15度 天气晴朗 空气质量优 出行方式为 步行。

今天温度15度 天气晴朗 控制质量轻度污染 出现方式为 公交车或地铁。

读取气温数据


[data, ~, raw] = xlsread('区县自动站实况数据.xlsx','Sheet2');

筛选对应日期数据

data=data(1:9649,:);
raw=raw(1:9649,:);

找出徐家汇地区的数据

index=strcmp(raw(:,3),'徐家汇')


读取空气质量数据


[data2, ~, raw2, dateNums] = xlsread('实时空气质量数据(历史)2.xlsx','Sheet1','','

筛选对应日期数据

data2=data2(4415:end,:);
raw2=raw2(4415:end,:);

得到对应时间

 index=1:3:2880


得到对应时间的 空气质量数据

 
mydata=[raw,raw2];


建立决策规则

分类类别号

 label=mydata(:,18);
%label=label(2:end);

将类别号赋值给outData

outData=label;

获得特征变量矩阵

inData = [data,data2];					% 输入特征矩阵

根据训练集数据创建决策树

classregtree(inData, o)


查看决策树

view(mytree);


点击标题查阅往期内容


数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化


左右滑动查看更多


01

02

03

04


决策树规则

Decision tree for classification

  1  if x5<11.5 then node 2 elseif x5>=11.5 then node 3 else 步行

  2  if x5<3.5 then node 4 elseif x5>=3.5 then node 5 else 步行

  3  if x13<0.45 then node 6 elseif x13>=0.45 then node 7 else 步行

  4  if x1<2.01504e+011 then node 8 elseif x1>=2.01504e+011 then node 9 else 公交车或地铁

  5  if x12<91.5 then node 10 elseif x12>=91.5 then node 11 else 步行

  6  if x11<11.5 then node 12 elseif x11>=11.5 then node 13 else 步行

  7  if x9<27.5 then node 14 elseif x9>=27.5 then node 15 else 公交车或地铁

  8  if x6<1.6 then node 16 elseif x6>=1.6 then node 17 else 公交车或地铁

  9  class = 步行

 10  if x8<86.5 then node 18 elseif x8>=86.5 then node 19 else 步行

 11  class = 公交车或地铁

 12  if x7<1.5 then node 20 elseif x7>=1.5 then node 21 else 步行

 13  if x9<94 then node 22 elseif x9>=94 then node 23 else 公交车或地铁

 14  if x9<8.5 then node 24 elseif x9>=8.5 then node 25 else 步行

 15  if x6<2.75 then node 26 elseif x6>=2.75 then node 27 else 公交车或地铁

 16  class = 公交车或地铁

 17  class = 步行

 18  class = 步行

 19  if x1<2.01502e+011 then node 28 elseif x1>=2.01502e+011 then node 29 else 步行

 20  class = 步行

 21  if x1<2.01504e+011 then node 30 elseif x1>=2.01504e+011 then node 31 else 步行

 22  if x4<6.95 then node 32 elseif x4>=6.95 then node 33 else 公交车或地铁

 23  class = 步行

 24  if x6<0.35 then node 34 elseif x6>=0.35 then node 35 else 公交车或地铁

 25  if x8<49.5 then node 36 elseif x8>=49.5 then node 37 else 步行

 26  if x6<2.25 then node 38 elseif x6>=2.25 then node 39 else 公交车或地铁

 27  if x11<26.5 then node 40 elseif x11>=26.5 then node 41 else 步行

 28  class = 步行

 29  class = 公交车或地铁

 30  class = 步行

 31  class = 公交车或地铁

 32  if x5<142.5 then node 42 elseif x5>=142.5 then node 43 else 步行

 33  class = 公交车或地铁

 34  class = 步行

 35  if x5<311 then node 44 elseif x5>=311 then node 45 else 公交车或地铁

 36  if x9<22 then node 46 elseif x9>=22 then node 47 else 公交车或地铁

 37  if x12<135 then node 48 elseif x12>=135 then node 49 else 步行

 38  if x5<102.5 then node 50 elseif x5>=102.5 then node 51 else 公交车或地铁

 39  if x8<18.5 then node 52 elseif x8>=18.5 then node 53 else 公交车或地铁

 40  if x12<40.5 then node 54 elseif x12>=40.5 then node 55 else 步行

 41  if x6<3 then node 56 elseif x6>=3 then node 57 else 公交车或地铁

 42  class = 步行

 43  if x1<2.01503e+011 then node 58 elseif x1>=2.01503e+011 then node 59 else 公交车或地铁

 44  class = 公交车或地铁

 45  class = 步行

 46  if x4<21.75 then node 60 elseif x4>=21.75 then node 61 else 公交车或地铁

 47  if x14<40.5 then node 62 elseif x14>=40.5 then node 63 else 步行

 48  if x12<78.5 then node 64 elseif x12>=78.5 then node 65 else 步行

 49  if x5<212 then node 66 elseif x5>=212 then node 67 else 公交车或地铁

 50  if x14<35.5 then node 68 elseif x14>=35.5 then node 69 else 公交车或地铁

 51  if x6<1.85 then node 70 elseif x6>=1.85 then node 71 else 步行

 52  class = 公交车或地铁

查看所有预测的分类标签

y_est

type classregtree

判断准确率

Remp

气温

 hist(inData(:,4))

风向

 hist(inData(:,5))

风速

 hist(inData(:,6))

O3

 hist(inData(:,10))

SO2

 hist(inData(:,11))

 NO2

 hist(inData(:,12))



本文中分析的数据分享到会员群,扫描下面二维码即可加群!




点击文末“阅读原文”

获取全文完整代码数据资料


本文选自《Matlab决策树对空气质量和天气温度及天气数据做交通出行推荐预测》。




点击标题查阅往期内容

数据分享|R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况
R语言是否对二分连续变量执行逻辑回归
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
R语言用局部加权回归(Lowess)对logistic逻辑回归诊断和残差分析
R语言用主成分PCA、 逻辑回归、决策树、随机森林分析心脏病数据并高维可视化
R语言用线性模型进行臭氧预测:加权泊松回归,普通最小二乘,加权负二项式模型,多重插补缺失值
R语言Bootstrap的岭回归和自适应LASSO回归可视化
R语言中回归和分类模型选择的性能指标
R语言多元时间序列滚动预测:ARIMA、回归、ARIMAX模型分析
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言计量经济学:虚拟变量(哑变量)在线性回归模型中的应用
R语言 线性混合效应模型实战案例
R语言混合效应逻辑回归(mixed effects logistic)模型分析肺癌数据
R语言如何用潜类别混合效应模型(LCMM)分析抑郁症状
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言建立和可视化混合效应模型mixed effect model
R语言LME4混合效应模型研究教师的受欢迎程度
R语言 线性混合效应模型实战案例
R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题
基于R语言的lmer混合线性回归模型
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
R语言分层线性模型案例
R语言用WinBUGS 软件对学术能力测验(SAT)建立分层模型
使用SAS,Stata,HLM,R,SPSS和Mplus的分层线性模型HLM
R语言用WinBUGS 软件对学术能力测验建立层次(分层)贝叶斯模型
SPSS中的多层(等级)线性模型Multilevel linear models研究整容手术数据
用SPSS估计HLM多层(层次)线性模型模型
R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言有RStan的多维验证性因子分析(CFA)
主成分分析(PCA)原理及R语言实现及分析实例
R语言无监督学习:PCA主成分分析可视化
R语言使用Metropolis- Hasting抽样算法进行逻辑回归
R语言多元Logistic逻辑回归 应用案例
R语言自适应LASSO 多项式回归、二元逻辑回归和岭回归应用分析
R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测
R语言基于树的方法:决策树,随机森林,Bagging,增强树
spss modeler用决策树神经网络预测ST的股票
R语言中自编基尼系数的CART回归决策树的实现
python在Scikit-learn中用决策树和随机森林预测NBA获胜者
matlab使用分位数随机森林(QRF)回归树检测异常值
基于随机森林、svm、CNN机器学习的风控欺诈识别模型
R语言惩罚logistic逻辑回归(LASSO,岭回归)高维变量选择的分类模型案例
R语言用标准最小二乘OLS,广义相加模型GAM ,样条函数进行逻辑回归LOGISTIC分类



拓端数据部落
拓端(tecdat.cn)创立于2016年,提供专业的数据分析与挖掘服务,致力于充分挖掘数据价值。
 最新文章