美赛中适合使用机器学习吗?

文摘   2025-01-10 17:52   内蒙古  
点击蓝字
 
关注我们

 如何看待今年美赛最后一天在除夕?

近年来,美赛的题目的数据量总体来说呈不断增加的趋势, 这是由于在科研界和工业界已积累了比较丰富的数据,伴随大数据概念的兴起及机器学习技术的发展,大家也许会想问会不会因为机器学习影响竞赛效果?用这个方法的人太多,已经没有新意?网上对于这一问题也是众说纷纭,和数乐君一起来看看网友们的看法吧!


机器学习适不适合在数学建模中使用?








网友1








不适合,因为机器学习严格说只是一套方法而并不是一个模型。什么是模型?条件变成方程,在限制条件下求解最优化问题,这叫模型;用ANN求解,这叫方法。

有说ANN本身也有套理论模型的啊怎么不算模型。从学科角度却是是模型,但是你能做到在40-60页论文里通过严谨的证明和阐述说清楚为何你构造的ANN是可以用来求当前问题最优解的么?你需要说明原问题的最优化近似如何与ANN的逼近一致,需要说明ANN的近似解与所求最优解的差异……这一切都不是一篇论文甚至一本书可以阐述清楚的。

再者,如果不能说明你的问题可以转化为一套近似算法的有效问题,你用任何方法都不会受到关注。机器学习很新,然而它求解的聚类问题却并不新。从数学建模竞赛的角度,反而不那么关注你用什么方法去求解一个问题,关注的是怎么把一个实际问题抽象成一套可计算模型而已。









网友2








机器学习无非就是通过数据训练电脑学习分类,回归或者聚类的规则,然后用这套规则给新的数据进行分类,回归或者聚类。那如果题目让你做分类,回归或者聚类的其中一个,那就不得不去用机器学习了。

机器学习有很复杂的模型,例如现在的所谓深度学习,学习到的规则几乎是无法用直观语言解释的。当然也有很简单的模型,例如线性回归,直接就能看到每个独立变量对应变量的作用。又或者聚类,说到底无非就是提出一个靠谱的距离函数,让离的近的点被归为一类。当然很可能复杂的模型效果好一些,但是对于简单的只有几个feature的数据集,简单的模型也不见得差。里头涉及机器学习里面的一些分析,就不详述了,有的我也不会。

而做数模,第一步是建模,就是把对问题的描述从现实语言翻译成数学语言。如果正好是分类,回归或者聚类(还有reinforcement learning啦),那就可以挑一个机器学习的算法来解,或者自己设计一个。这些算法自然是越容易直观解释越好,但是假如效果太差的话也可以用复杂一些的算法试试(也不一定好)。

数乐君有话说

在美赛的评委眼中,其实有三大明确的评阅原则:拒绝过度套路化,论文模版化、方法套路化。

但美赛中一直有一个误区,好像大家都觉得一定要用非常高级的模型求解,就显得非常厉害,非常高级,其实这是不对的。复杂的问题你用简单的方法做出来,而且别人一看就能懂,这才叫厉害,简单的问题你用困难的方法做出来,别人需要看半天才模模糊糊懂,就显得多此一举了。

其实任何一个模型都没有绝对的好坏,只有优和更优。而机器学习也要看你应用在的场合,具体问题具体分析,任何方法都会有一定的缺点,但它仍旧是数学建模中的一种方法,就还是有一定道理和理论支撑的。

机器学习方法

机器学习是一门多领域交叉学科,它涉及到概率论、统计学、计算机科学以及软件工程。机器学习是指一套工具或方法,凭借这套工具和方法,利用历史数据对机器进行“训练”进而“学习”到某种模式或规律,并建立预测未来结果的模型。


机器学习根据任务类型的不同可划分为监督学习、 无监督学习、 弱监督学习和强化学习. 

  • 监督学习的任务是利用已标记的训练数据来训练模型,主要的模型包括K近邻(K-nearest neighbors,KNN)、决策树、朴素贝叶斯、Fisher判别器、支持向量机(support vector machine,SVM)和回归模型等. 

  • 无监督学习的任务是利用未标记的训练数据来训练模型, 主要的模型包括K-means、 谱聚类和降维等. 

  • 弱监督学习的任务是用大量的未标记训练数据和少量的已标记数据来训练模型,通过简单的标签去完成困难的任务,主要的模型包括自学习、EM(expectation maximization)和多实例学习等. 

  • 强化学习的任务是从系统与环境的大量交互知识中训练模型,主要的模型包括Q-learning和DQN(deep Q network)等. 

根据算法类型,机器学习又可以划分为传统统计学习和深度学习. 

  • 传统统计学习是基于数学模型的机器学习方法, 包括SVM、决策树和KNN等. 这一类算法基于严格的数学推理,具有可解释性强、运行速度快、可应用于小规模数据集的特点. 

  • 深度学习是基于神经网络的机器学习方法,主要的模型包括卷积神经网络(CNN)、循环神经网络(RNN)、图神经网络(GNN)、自动编码器(AE)、受限玻尔兹曼机(RBM)和生成式对抗网络(GAN)等. 这一类算法基于神经网络,可解释性较差,强烈依赖于数据集规模. 但是这类算法在语音、视觉和自然语言等领域非常成功.



MATLAB 统计与机器学习工具箱(Statistics and Machine Learning Toolbox)支持大量的分类模型、回归模型和聚类的模型,并提供专门应用程序(APP),以图形化的方式实现模型的训练、验证,以及模型之间的比较。

文章来源:数模乐园编辑整理,部分内容源于网络,未经允许,禁止转裁

2025美赛报名倒计时最后14天!


2025年美赛报名进入高峰期!

为使同学们省去美赛报名的繁琐流程

为解决VISA卡支付问题

为更好的提升参赛者的获奖率

现针对美赛特推出美赛辅助报名

截至2025年1月10日17:30

当前2025美赛报名超10060+支队伍

↓↓

数模乐园已累计为23万多人以上同学完成了美赛辅助报名服务!已成为国内最大、价格最低、参赛院校最广的美赛辅助报名平台!数模乐园辅助报名不仅仅只是一个单纯报名服务,后续赛前指导、赛中操作流程及注意事项指引等竞赛故障问题,全程免费为参赛者服务,服务好评率100%、报名成功率100%、高校覆盖率100%。




01
报名方式及费用

扫码立即报名


或复制报名官方网址

https://www.nmmcm.org.cn/match_detail/35



注意:

美赛辅助报名完成后,会在工作时间内将报名成功的邮件发送至该参赛队伍的队长邮箱里。离报名截止时间越近,报名的队伍就越多,为避免造成报名拥堵及邮件接收延迟问题,强烈建议想要参赛的同学尽早完成报名工作!




02
报名优势

1.通过数模乐园辅助报名流程简单,直接在线缴费报名,使用微信/支付宝即可缴费,无须VISA等国外银行卡,很大程度地方便了学生的报名。

2.数模乐园辅助报名全网价格最低,服务好评率100%、报名成功率100%、高校覆盖率100%。

3.数模乐园报名通道简单安全,报名后在队长邮件中收到美赛报名成功的通知。

4.额外赠送大量赛前学习资料、视频、课程、数模软件以及赛题翻译等服务(报名后无需等待立即开始学习、而且报名同学同享)。

5.美赛辅助报名可为学生团队提供正规增值税电子发票(美赛官方不提供发票),方便赛后学生团队报销报名费。

6.邀请了数学建模专家进行美赛赛前公开课讲解(直播)

7.美赛等级证书只有自行下载的电子版,数模乐园可打印并邮寄高质量纸质版证书。

8.比赛期间的时间、流程安排导航,资源共享下载。

9.快速帮您寻找最合拍的队友,让您不再为组队而烦恼。

10.支持比赛后成绩提前查询下载通道,2024年美赛,国内院校95%通过数模乐园查询通道提前完成美赛成绩查询

11.提供赛前千人学习交流大群,和全球参赛者共同备战交流。




往期推荐




“阅读原文”一起来报名2025年美赛吧!
扫码关注
小红书:数模乐园、数模乐园视频号
知乎:数模乐园


数模乐园
专注于数学建模竞赛领域公众号,分享数学建模赛事资讯、软件教程、算法模型、经验心得等数学建模干货知识,欢迎关注!
 最新文章