首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

机器学习第一次笔记-学术要求和部分概念自学资料汇总

文摘 2024-08-30 09:00 中国澳门

机器学习是一个非常重要的算法，基于同学们本科专业背景不一样，那么我就给这次课程一些案例配上我写的数模项目辅助理解，在写之前，推荐一下我的师弟写的机器学习合集的技术文章，讲的更仔细，也好懂。

那好我们开始吧。这次课程讲的概念不多，但是都很重要。

有关基础的机器学习基础概念，数据，有关回归和分类（这个单词截图截掉了）的算法，包括机器学习的介绍。

拓展书籍：M. Minsky, The Society of Mind，心智社会，机械出版社，2018. ◼ Yann LeCun，Quand La Machine Apprend，科学之路-人、机器与未来，中信出版集团，2021

划重点作业要求：Assignments: 3 Assignments, 1 Test, and 1 final Project (Oral Presentation and Report)。说简单一点就是作业要展示做报告，然后有全英语的考试。

这门课和模式识别和统计这门课联系非常紧密。

第一步数据收集，收集的方式爬虫，开源数据集；第二步数据预处理，这一步需要你有丰富的统计学知识（拓展：正态分布检测，缺失值填充，异常值的处理）；第三步是模型选择，后面的步骤就是模型去学习调整参数，到模型接受游戏结束。我对这个图的理解是算法为数据模型服务。

机器学习分为监督学习，无监督学习和弱监督学习，其实就是监督程度不同让模型的效果不同。监督学习里面有回归，分类和排序。无监督学习典型的聚类分析，弱监督学习有强化学习和半监督学习。

理解一下h(x)的含义hypothesis n.假说，假设。想一想为什么？

分类问题是吧，这样吧给同学们看看我写的数模项目，轻松理解二分类和多分类。

优秀数模解题思路分享-2022年数模国赛C题玻璃题的完整思路代码分享这个题目是典型的二分类问题，代码完整支持结果复现。

五一开源专题--盘点一下我近期的数学建模开源

你们进去看看2023年华中杯A题，那个药物数据分析就是典型的多分类问题，不是我说，叶老师的研究方向就是药物发现。

所以，我们总结一下：h（x）其实就是众多x和y的一个关系，这种映射关系，函数关系，我们叫做机器学习啦！

别的都好理解，重点理解一下PCA和ICA，这个PCA是主成分分析的意思，ICA是独立成分分析的意思，记住I，independent。

PCA这样说吧，其实这个玩意是数据预处理算法，在做特征的时候会有好效果。

这里讲完了，我们来看看公式：

E代表数学期望，P是概率密度，Loss是损失L函数嘛。这里表达写的比较抽象实际很好理解。

理解N这个是取均值就OK。后面有一个小点是训练和正则化，等后面有好的例子了，我们在深入理解。

本节课最后一个小点就是混淆矩阵，来吧，我们用统计学这本书假设检验的知识解释一下：

混淆矩阵这边讲了有两类错误，用统计学假设检验的说法的话就是有一种是弃真错误（第一类错误），另一种是纳伪错误（第二类错误），我们搬运假设检验这个知识点是来辅助理解混淆矩阵的哈。如果是阳性的预测成阴性，弃真，另外的一种是阴性不好意思，预测错了搞成了阳性，假阳性嘛。这个好理解撒。

本次课程就分享到这里，我们下次再见。

发布数模协会培训推文，讲解数模算法。赛题讲解及比赛通知。学校竞赛结果及学校竞赛成绩发布等文章。

最新文章

北太案例-利用北太天元竞赛版本求解2024年数学建模国赛B题第2，3问

零基础不本地安装怎么写latex-没关系我教你用overleaf写

2024年数学建模国赛B题快速复盘-思路简单分析

2024年中葡体育科学研讨会（足球科学训练）-参会感想（赠送体育大数据开源项目）

教师节快乐！写给每一个老师和布道师

2024年数学建模竞赛A,B,C题快速评价和国产工具使用反馈（含教学建议）

数学建模竞赛复盘要求和资源使用规范

机器学习第二次笔记-机器学习基础12问课后习题解答（考点建议收藏）

物联网基础第二次笔记-我赠送给同学们作业模板latex源码

大数据概论第二次笔记-好酷啊，数据可视化工具居然这么多！

马上就数学建模国赛了，请各位参赛同学检查自己的装备-北太天元，SPSSPRO和杉数求解器

2023年华为杯研究生数学建模竞赛C题代码分享-spsspro和杉数求解器启动

概率论与数理统计第二次笔记-分享两道例题

2024年数学建模高教社杯国赛要开始了，我帮同学们整理了往次比赛的开源代码（建议收藏）

Datawhale数学建模组队学习优秀笔记2024年8月

机器学习第一次笔记-学术要求和部分概念自学资料汇总

2022年数模国赛B题完整思路和部分代码分享-模拟赛优秀作品分享

划重点-大数据概论第一次课程笔记（怎么顺利毕业！）

优秀数模解题思路分享-2022年数模国赛C题玻璃题的完整思路代码分享

解题思路分享-2022年华中杯数模竞赛A题思路分析和完整代码分享

供应链推式与拉式：一块硬币的两面

澳门理工留学经验帖-选择合适的电话卡

参会感想整理-2024Hong Kong RISC-V Day +AI CON

直播回顾 | UIUC 赵梓硕：同伴预测机制在区块链共识与可信AI中的应用「OR Talk 31」

高级概率论与数理统计第一课-导论

物联网基础第一课-学习注意事项（含latex和华为物联网课程）

【Presolve (一)】整数规划预求解技术 Simple Probing 算法

分享一点物流公开课信息20240822

分享一点澳门留学更新想法-含留学生来澳门前需要准备的材料（入学和学术篇）

留学生活开始了，总结一点澳理工留学生活经验！（坐公交车）

写一写对布道师这个词的认识和想法，于是我计划......

第六届八一赛非数组A类填空题参考解答

Datawhale AI夏令营逻辑推理学习笔记Task2

我在Datawhale当助教系列-暑假组队学习开源博客写作指导-以数学建模组队学习为例

北太天元在《数值方法：原理、算法及应用》中的教学实践-记录观看的一点想法

杉数求解器-囚徒博弈问题（观看讲座对比北太天元，杉数求解器）

考研数学分析与高等代数学习总结

杉数求解器-多商品问题加强版本

杉数求解器-多商品问题的求解（数模玩家必看）

杉数求解器—尝试求解2024年亚太赛中文赛C题

Datawhale第三期AI夏令营喊你报名啦！！！

数学建模导论课程开课通知！

往届八一杯数学竞赛试题汇总

北太案例-利用北太天元求解2021年北京大学强基计划数论题

为什么国内学术界卷的飞起但工业界的技术仍然十分落后？

Datawhale第二期AI夏令营-机器学习-电力需求预测挑战赛尝试第三次-终于反击baseline

利用科大讯飞星火认知大模型求解2024年北京大学强基计划语文试题

北太案例-利用北太天元求解2024年北京大学强基计划真题

机器学习方法系列36——完结撒花！就用马尔可夫链画上句号叭！

机器学习方法系列35——使用朴素Bayes的新闻文档分类任务

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉