2024全国大学生数学建模竞赛 | 五类模型及30+常用算法总结

科技   教育   2024-08-20 11:54   北京  

近期多项数学建模竞赛陆续展开,2024“华数杯”已于8月4日开赛,题目类型、难度和国赛类似,所以“华数杯”比赛也可作为9月份国赛前的全真模拟赛。

对于首次参赛的数据分析新手,如何在短时间内提升自己队伍的竞争力?关键在于掌握常用模型和算法,并能熟练运用软件工具数学建模常用模型大致可分为五类:
  • 评价模型

  • 预测模型
  • 分类模型
  • 优化模型
  • 统计分析模型


下面将对这些模型的分析步骤以及软件操作进行详细介绍。


一、数学建模常用五类模型



  • 评价模型(Evaluation Model)

评价模型主要用于衡量和评估某个对象或过程的性能、效果或质量。通过定义一系列指标和标准,评价模型帮助我们定量或定性地判断研究对象的优劣,并为改进和优化提供依据。在数学建模竞赛中,评价模型用于衡量方案或系统的效果和性能。通过设定具体的评价指标,如准确性、稳定性和效率,竞赛团队可以定量比较不同方案的优劣,进而选择最优的解决方案。


  • 预测模型(Prediction Model)

预测模型利用历史数据和统计方法来预测未来的趋势或结果。预测模型在数学建模竞赛中用于预测未来的趋势或结果,基于历史数据和相关变量。竞赛团队可能使用时间序列分析、回归模型或机器学习算法,应用于诸如市场需求预测、人口增长预测等题目。


  • 分类模型

分类模型是一种机器学习模型,用于将输入数据分配到预定义的类别中。分类模型在数学建模竞赛中用于将数据分配到预定义的类别中。竞赛题目可能涉及数据分类的问题,如垃圾邮件检测、信用风险评估等,参赛团队可能使用决策树、支持向量机或神经网络来解决这些问题。


  • 优化模型(Optimization Model)

优化模型在数学建模竞赛中用于寻找某个目标函数的最优解,通常在特定的约束条件下。竞赛题目可能涉及资源分配、物流配送或生产计划等问题,团队可能使用线性规划、整数规划或其他优化算法来寻找最优解。


  • 统计分析模型(Statistical Model)

除了以上四大模型,在数学建模一些小问题的分析中,还会涉及到其他比较简单的统计分析模型,参赛团队可能需要进行数据处理、描述统计、相关分析、假设检验等。通过分析数据的统计特性,揭示数据背后的规律和关系。


其中评价模型、预测模型、分类模型、统计分析模型一些常用算法如下:

接下来,将逐个模型进行说明。


二、评价模型


数学建模中评价类模型的常用算法有层次分析法、灰色关联法、模糊综合评价、TOPSIS法、数据包络分析、组合评价法等。

1

层次分析法


层次分析法是一种多准则决策方法,常用于复杂系统的分析和评价。它通过将复杂问题分解为若干层次和因素,并按照不同因素的重要性进行打分,最终通过合成各层权重得出不同方案的总体评价。AHP的优点在于能够将定性分析与定量分析相结合,结构清晰,易于操作。然而,它也存在主观性较强、一致性检验可能失效等缺点。


AHP层次分析法包括两个步骤,分别是权重计算和一致性检验(SPSSAU会默认输出);

  • SPSSAU软件操作:
AHP层次分析法的数据格式比较特殊,需要手工录入判断矩阵,如下图:


判断矩阵解读:门票相对于景色来讲,重要性更高,所以为3分;相反,景色相对于门票来讲,则为0.33333分。交通相对于景色来更重要为2分,其余类似下去。

AHP层次分析详细说明及案例操作解读请点击查看下方帮助手册:

AHP层次分析法帮助手册


2

灰色关联法


灰色关联分析法通过研究数据关联性大小(母序列与特征序列之间的关联程度),通过关联度(即关联性大小)进行度量数据之间的关联程度,从而辅助决策的一种研究方法。

(1)灰色关联法分析步骤:
第一步:确定母序列和特征序列,且准备好数据格式;
第二步:针对数据进行无量纲化处理(通常情况下需要);
第三步:求解母序列和特征序列之间的灰色关联系数值;
第四步:求解关联度值;
第五步:对关联度值进行排序,得出结论。

(2)SPSSAU软件操作
将数据上传至SPSSAU系统,分析页面右侧选择【灰色关联法】;将变量拖拽到右侧相应分析框中,选择“量纲化方式”,点击“开始分析”,操作如下图:


灰色关联法详细说明及案例操作解读请点击查看下方帮助手册

灰色关联法帮助手册


3

模糊综合评价


模糊综合评价是一种处理不确定性和模糊性问题的数学建模方法,它利用模糊数学的理论,将定性评价转化为定量评价。

(1)模糊综合评价分析步骤
第一步:确定评价指标和评语集;
第二步:确定权重向量矩阵A和构造权重判断矩阵R;
第三步:计算权重并进行决策评价。

(2)SPSSAU软件操作
上传数据至SPSSAU系统,分析页面右侧选择【模糊综合评价】,将变量拖拽到右侧相应的分析框中,点击“开始分析”,操作图下图:


模糊综合评价详细说明及案例操作解读请点击查看下方帮助手册

模糊综合评价帮助手册


4

TOPSIS法


TOPSIS法即逼近理想解排序法,是一种多属性决策分析工具。该方法通过计算每个方案与理想解和负理想解的距离,来确定各方案的相对优劣TOPSIS法能够较好地处理多属性决策问题,特别适用于需要考虑多个评价指标的情况。

(1)TOPSIS法分析步骤
第一步:准备好数据,并且进行同趋势化处理(需要研究者自行处理);
第二步:数据归一化处理解决量纲问题(数据处理->生成变量,通常选择‘平方和归一化’);
第三步:找出最优和最劣矩阵向量(SPSSAU自动处理);
第四步:分别计算评价对象与正理想解距离D+或负理想解距离D-;
第五步:结合距离值计算得出接近程序C值,并且进行排序,得出结论。

(2)SPSSAU软件操作
上传数据至SPSSAU系统,分析页面右侧选择【TOPSIS法】;将变量拖拽到右侧分析框中;点击“开始分析”,操作如下图:


TOPSIS法详细说明及案例操作解读请点击查看下方帮助手册

TOPSIS法帮助手册


5

数据包络分析DEA


数据包络分析DEA是一种多指标投入和产出评价的研究方法其应用数学规划模型计算比较决策单元(DMU)之间的相对效率,对评价对象做出评价。

数据包络分析DEA时,首先需要分析综合效益值θ,即首先判断DMU是否有DEA有效,如果有效,则说明该DMU较优,反之说明‘非DEA有效’,即相对来说还有提升空间,那么提升空间具体在哪里呢,比如提高还是减少规模呢,可以通过规模效益分析得到。与此同时,如果是‘非DEA有效’,那么具体问题是什么,投入冗余还是产出不足,则可以通过对应的投入冗余或产出不足分析表格得出,具体数字直接查看松驰变量即可。

  • SPSSAU软件操作
将数据上传至SPSSAU系统,分析页面右侧选择【DEA】,将变量拖拽到右侧相应分析框中,选择“DEA类型”,点击“开始分析”,操作如下图:


数据包络分析DEA详细说明及案例操作解读请点击查看下方帮助手册

数据包络分析DEA帮助手册


6

组合评价法


组合评价法是指将两种或两种以上的评价方法结合起来使用,以弥补单一评价方法的不足,提高评价结果的准确性和可靠性。

  • 组合评价法分析步骤:
第一步:选择评价方法,根据评价问题的特点,选择几种适合的评价方法,这些方法可以是定性的也可以是定量的。
第二步:使用每种选定的评价方法对同一组对象进行独立评价,得到各自的评价结果。
第三步:将不同评价方法得到的结果进行整合,整合方式可以是简单的加权平均、排序合并,也可以是更复杂的统计或算法模型。
第四步:一致性检验,检查不同评价方法的结果是否一致,如果不一致,分析原因并考虑调整评价方法或权重分配。
第五步:根据整合后的结果,对评价对象进行最终评价。

三、预测模型


预测类模型的常用算法有回归分析预测、时间序列预测、灰色预测模型、马尔科夫预测、神经网络、支持向量机等。


(1)回归分析预测



(2)时间序列预测



(3)机器学习预测



预测类分析方法在以往文章中已经梳理过,详细介绍可以参考以下文章,篇幅有限在此不再进行赘述,可点击下方文章进行学习:
常用预测类数据分析方法分类汇总

四、分类模型


数学建模中常用的分类模型有逻辑回归、决策树、随机森林、朴素贝叶斯、KNN等。

1

逻辑回归


逻辑回归是一种广泛应用于分类问题的统计方法,尽管其名称包含“回归”,但它实际上也是一种用于二分类或多分类问题的分类算法。逻辑回归通过估计一个事件发生的概率来预测类别标签,由于其简单、易于理解和实现,以及在分类问题中的有效性,成为了机器学习和数据分析中非常流行的算法。

  • SPSSAU软件操作:
上传数据至SPSSAU系统,分析页面右侧选择【logit回归】;将变量拖拽到右侧分析框中,选择变量进入方式,点击“开始分析”,操作如下图:


逻辑回归详细说明及案例操作解读请点击查看下方帮助手册

二元logit回归

多分类logit回归

有序logit回归


2

决策树、随机森林等


决策树、随机森林、朴素贝叶斯、KNN这几种方法均属于机器学习算法,在SPSSAU的机器学习模块中,选择对应分析方法进行分析即可。

以随机森林为例,上传数据至SPSSAU系统,将变量拖拽到右侧相应分析框,选择训练集比例、数据处理方式并进行更多参数设置,操作如下图:


机器学习详细说明及案例操作解读请点击查看下方帮助手册及以往文章

决策树

随机森林

朴素贝叶斯

KNN

六种机器学习算法大揭秘:从决策树到神经网络,小白也能轻松掌握!

五、统计分析模型


除以上常见的四大模型,在分析各个小点的时候,数学建模还会涉及一些简单的统计分析方法,比如差异性分析、相关性分析、回归分析、聚类分析、数据降维分析等,具体常用方法如下:



1

差异性分析


数学建模中常用的差异性分析方法包括t检验、方差分析、卡方检验等,它们可以用于判断样本和总体之间是否存在显著差异,以及变量之间是否存在相关性或影响关系。


关于差异性分析更多知识可以参考下面这篇文章:
科研论文差异性分析,如何选择正确的统计学方法

2

相关性分析


相关分析用于分析变量之间的相关关系,包括是否有关系以及关系的紧密程度。在数学建模中,相关分析可用于衡量变量的关联性、选择变量、验证假设和推断、变量优化等。SPSSAU提供三类相关系数:Pearson系数、Spearman系数、Kendall协调系数


  • 三类相关系数及使用场景:



相关分析详细说明及案例操作解读请点击查看下方帮助手册

相关分析帮助手册


3

回归分析


回归分析简单来讲就是用于分析自变量X与因变量Y之间的影响关系的方法。回归分析主要基于自变量X的值预测因变量Y的值,通过构造回归模型,帮助理解自变量如何影响因变量,以及各个自变量对因变量的影响程度。

回归分析可细分为40多种,常用的有多元线性回归、logistic回归、岭回归、逐步回归、lasso回归等。关于回归分析往期内容进行过详细说明,可点击下方文章进行学习:
如何研究X与Y之间的影响关系?实证分析40+回归模型汇总整理

4

聚类分析


聚类分析方法可分为Q型聚类和R型聚类,如下图:


有关4种聚类分析算法相关知识,可点击下方文章进行学习:

干货合集→聚类分析


5

数据降维


因子分析和主成分分析都是常用的数据降维方法,但它们的应用场景略有不同。主成分分析适合于变量之间相关性较高、需要提取重要变量或简化数据结构的情况;而因子分析适合于探索潜在因素、发现变量之间的共性或隐含关系的情况。选择哪种方法取决于具体的分析目的和数据特征。


主成分分析和因子分析详细说明及案例操作解读请点击查看下方帮助手册
主成分分析帮助手册
因子分析帮助手册



使用SPSSAU进行数学建模,非常方便且智能。SPSSAU作为一款在线数据分析平台,提供了丰富的统计分析功能和简洁的操作界面,让数学建模变得更加高效。无论是数据处理、模型构建还是结果解读,SPSSAU都能以直观的方式帮助用户轻松完成,大大提升了数学建模的便捷性和智能化水平。




若要了解数据分析方法相关的更详细知识,可进入SPSSAU官网查看帮助手册or联系智能客服or人工客服为您解答。



以上就是今天的全部内容啦~

若您想看其他干货内容

请在评论区告诉SPSSAU







数据分析救命神器

让你的数据处理

非常简单!


点击下方  跳转至SPSSAU官方账号





SPSSAU

数据科学分析平台

www.spssau.com



SPSSAU
SPSSAU官网: https://spssau.com
 最新文章