关注SPSSAU
数据分析 简单一点
论文问卷 快人一步
数学建模国赛
SPSSAU出品 · 必属精品 · 建议收藏
↓↓↓↓↓↓↓↓
SPSSAU
数学建模常用方法大致可分为四大部分:数据预处理、基本描述、建模、模型评价,如下图:
接下来将逐个进行介绍说明。
一、数据预处理
国赛的数据预处理是指进行数据的清洗和变换,预处理的质量会直接影响到后续建模和预测的准确性。数据清洗也就是我们常说的缺失值处理和异常值处理,数据变换是指对数据进行标准化、归一化等无量纲化处理,常见的数据预处理方式见下图:
异常值也称离群值,其数值明显偏离它所属样本集的其余观测值。忽视异常值的存在可能会对建模结果产生不良影响。
可视化方法:使用箱线图、散点图等可视化工具来识别异常值。 统计方法:使用Z-score、IQR(四分位距)等方法来识别数据点是否为异常值。
异常值处理通常有以下4种方式:
对缺失值进行处理方法通常有删除、填充、插值3类方法,说明如下表:
对于异常值和缺失值的处理,可以使用SPSSAU【数据处理】模块的【异常值】方法进行处理,操作如下:
点击下方链接跳转至相应方法帮助手册:
量纲处理是指通过数据变换来消除原始变量的量纲影响的方法,使模型更加稳定和准确。常见的量纲处理方法包括标准化、归一化、中心化、正向化、逆向化、适度化等等,说明如下:
SPSSAU提供17种数据无量纲化处理方法,在【数据处理】模块选择【生成变量】操作如下:
选择合适的无量纲化方法取决于数据的分布特征和后续建模的需求。通常需要尝试多种方法并比较效果。点击下方链接跳转至相应方法帮助手册:
二、描述性分析
在数学建模中,描述性统计分析是一种基本的数据探索方法,是理解数据特征的重要步骤。它帮助模型开发者理解数据的基本特征、分布情况以及变量之间的关系。
计算基本统计量:均值、中位数、标准差等 绘制可视化图表:直方图、箱线图等 分析数据分布:是否正态分布,是否有偏态 检查相关性:变量间的关系
点击下方链接跳转至相应方法帮助手册:
三、建模
数学建模关键的步骤就在于模型的选择与构建,根据问题的性质选择合适的模型类型,如分类模型、评价模型、预测模型等。
(1)聚类分析
常用的聚类分析分为K-means聚类、K-modes聚类、K-prototype聚类以及分层聚类。其中前三种聚类方法是按行聚类(R型聚类),分层聚类是按列聚类(Q型),最常用的为K-means聚类,各自适用场景说明如下表:
点击下方链接跳转至相应方法帮助手册:
点击下方链接跳转至相应方法帮助手册:
点击下方链接跳转至相应方法帮助手册:
多元线性回归
四、模型评估
在进行模型构建与分析时,模型评价是非常关键的一步。合适的评价指标可以帮助我们准确地衡量模型的性能,从而进行优化和改进。然而,不同的模型和应用场景需要使用不同的评价指标。下图为回归模型和分类模型常用评价指标:
关于模型评价常用指标可以查看下方文章,已经做过总结:
以上就是数学建模竞赛可能涉及到的大部分模型以及方法,使用SPSSAU系统都可以快速完成,即便是不会建模的小白,也可以冲刺一下奖项哦~
以上就是今天的全部内容啦~
若您想看其他干货内容
请在评论区告诉SPSSAU
数据分析救命神器
让你的数据处理
非常简单!
点击下方 跳转至SPSSAU官方账号