首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

值得收藏！机器学习法常用的分析方法

健康 2024-10-21 08:11 浙江

引言

如今机器学习的热度越来越高，尤其是前段时间的诺奖，颁给了两位机器学习领域的专家！

不少学者表示“意料之外”，但也在“情理之中”。

今天将我们继续介绍机器学习中常用的算法！

在机器学习领域，有种说法叫做“No Free Lunch（世上没有免费的午餐）“，它是指没有任何一种算法能在每个问题上都能有最好的效果，这个理论在监督学习方面体现得尤为重要。

这就需要我们对不同算法及其特性有所了解。

首先，借用鲁伟老师编写的《机器学习：公式推导与代码实现》一书中的插图，该图对机器学习模型做了分类汇总，介绍得也较为全面。

图中提到的监督模型，简单来说就是模型通过学习有标准答案的数据来总结规律。

例如，训练模型中有很多动物的图片及其标记(记号)。标记可用来说明动物的类型，有些图片是猫，有些图片是狗。理论上讲，在经过训练之后，模型可以预测新的图片是猫还是狗。

而无监督模型则是模型通过学习没有答案的数据来总结规律，它需要根据数据本身的特点来发掘信息。

例如，某家公司在不同的超市销售文具，我们想知道不同类型消费者的行为。经过研究，我们可能会发现有一些小公司的客户喜欢买铅笔和笔记本。而另一类大公司的客户喜欢买办公桌和办公椅。因此，对于不同类型的公司客户，我们就可以采用不同的市场策略。

概率模型则是模型基于概率论方法通过数据学习变量之间的概率关系。

在上述的图片中，我们可以看到，作者把传统统计方法，例如线性模型也归为机器学习模型。

个人认为传统统计模型的思想也是利用算法挖掘数据背后的规律来解决问题，也可以进行监督学习任务等。

因此，广义上来说，传统统计模型也可以归为机器学习模型。

医学研究中最常见的是监督学习模型，主要用于预测模型，包括诊断模型和预后模型的构建。

✅在这些监督学习模型中，常用的模型包括：一般线性回归、Logistic回归、LASSO回归、决策树、神经网络、支持向量机、XGBoost和随机森林。

因此，本专栏的后续推文将分别对这些模型进行讲解，概述这些模型的特点及其背后的思想，让大家对这些模型有一个大致的理解，从而帮助大家在科研时选择合适的模型、设置合理的参数。

✅同时，无监督学习模型在医学研究中也得到了一定的应用，其中较为常用的模型是k均值聚类和PCA，之后也将对这两种方法进行讲解。

✅相对而言，概率模型在医学研究中的应用则较少。

机器学习并不是魔法，没有那么复杂神秘，只要我们理解了背后的思想，掌握一定的工具，就可以自由的应用它来解决实际问题了。

感兴趣的不妨跟着本专栏的后续文章，我们一起去揭开机器学习的面纱，去了解方法的工作原理并开展实践吧！

关于郑老师统计团队及公众号

全国最大的线上医学统计平台，专注于医学生、医护工作者学术研究统计支持，我们是你们统计助理！

我们提供以下科研与统计服务：

①研究者发起的临床、护理试验项目

②医院回顾性数据分析与预测模型

③医学数据库SEER、NHANES、GBD、孟德尔随机化等挖掘发表级数据

④预测模型、GBD、NHANES医学数据库挖掘1对1R语言指导

联系助教小董咨询（微信号aq566665）

http://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650445281&idx=2&sn=b4226568aef8f96e46c24a1309fed497

医学论文与统计分析

本号为高校统计学老师所设，介绍医学论文进展与统计学方法，SPSS分析方法、真实世界研究、R语言与数据挖掘。关注后，发送关键词“33”到公众号就可以获取常见的统计软件比如Spss，sas，PASS（绝对无毒）等

最新文章

缺失数据填补新方法：递归特征消除+随机森林，也许更优！

IF=96.2！交大院士团队发文NEJM，强化血压干预可降低糖尿病患者21%心血管风险

年底大课！零基础入门的“机器学习”预测模型，欢迎报名

《柳叶刀》为何发表中国学者中医药研究阴性结果的文章？

SHAP可视化方法，临床预测模型解释新框架！

可预开发票，郑老师团队25年统计新课预告，发表文章后退款

Lancet重磅！首次刊登中草药临床研究，中国学者喜提咖位，还是个阴性结果

挑战半天搞定一篇NHANES！10分钟教你解决数据清洗大难题！

北大学子发表JAMA论文：中国医学生感知受虐率高达84.5%

可预开发票，郑老师团队25年统计新课预告，发表文章后退款

SHAP法可解释性机器学习介绍：理论与方法

不少文章这个样本量计算公式都写错了，你注意到了吗？

IF=63.1，共病研究登顶JAMA正刊，谁说NHANES免费数据库发不了好文章？

零基础入门的“机器学习”预测模型，我们的机器学习培训课程来了

机器学习+SHAP建模，预测模型就是好文章？求你们了，别玩偏了

机器学习入门（4）| 一般线性模型

JAMA子刊：三组比较先别用倾向得分匹配，考虑用重叠加权

可预开发票，郑老师团队25年统计新课预告，总计17门课

审稿人：仅仅报告P值是不够的，请提供主要结局的效应量

开课啦！新一期公开免费课“30天学会SPSS与R语言”，欢迎报名

可预开发票，郑老师团队25年统计新课预告，机器学习课程马上来了

Lancet子刊：中国学者用9种机器学习算法构建可解释性临床预测模型

2025年我们将提供统计服务！医院临床/护理数据分析，可预开发票

BMJ：临床预测模型，超长分步指南！

可预开发票，郑老师团队25年统计新课预告，机器学习课程马上来了

又一个免费数据库！川大华西朱彩蓉团队用20种癌症数据+趋势性分析，拿下JAMA子刊

可预开发票，郑老师团队2024-25年科研统计课程预告，共17门课

时代变了，“SHAP” 取代“列线图”，成为预测模型文章标题的重点

可预开发票，郑老师团队2024-25年科研统计课程预告，共17门课

新一代“神药”？JAMA文章显示，减肥药"司美格鲁肽"，或可降低67%老年痴呆风险

可预开发票，郑老师团队2024-25年科研统计课程预告，含机器学习、轨迹模型等

IF=8.5！仅以常规体检数据，厦大学者用5种机器学习方法构建了心血管预测模型

可预开发票，郑老师团队2024-25年科研统计课程预告，含机器学习、轨迹模型等

SPSS 30.0新版来了，这次有什么新功能？

IF=93.6！复旦大学邵志敏教授团队发文医学顶刊BMJ杂志

半天搞定NHANES一篇SCI论文的利器来了！自动下载、自动加权、快速出图表

大数据：首篇论文发表10年后，半数学者退圈。你还会坚持吗？

孟德尔随机化课程，入门到高级，郑老师团队主讲，一个月搞定，快速发表论文，立即可学！

IF=22.5！中医临床研究发文JAMA子刊，针灸治疗椎间盘突出症疼痛效果明显

选对工具很重要！师姐花了1天写代码，我3分钟完成倾向得分匹配分析

真实世界临床研究怎么做统计分析可以发SCI呢？看郑老师主讲的这门课程就够了

IF=63.1！一周之内，中山大学连发JAMA、BMJ 2篇顶刊文章

NHANES医学数据库挖掘R语言实操，欢迎报名，一天搞定，就在周日

浙大学者结合血浆蛋白质组学等，开发结直肠癌发病预测模型，发文Nature子刊，来看看过程与统计方法

值得收藏！机器学习法常用的分析方法

就在本周末，2024年NHANES医学数据库挖掘直播课，欢迎报名，发文后退款

IF=93.6！中山大学发文顶刊BMJ杂志

NHANES新数据，欢迎参加郑老师团队第2期NHANES 挖掘1对1指导班！

开课啦！新一期公益免费课“30天学会SPSS与R语言”，欢迎报名，有问必答

南方医科大学学者开展巢式病例对照研究发文JAMA子刊，这种设计思路可借鉴一下

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉