机器学习基础 —— 混淆矩阵

文摘 2024-10-14 22:54 德国

混淆矩阵（Confusion Matrix）是评估分类算法性能的基本工具。通过它，我们可以了解分类模型在预测中表现出色的部分以及出现错误的部分。特别是在机器学习任务中，模型的预测结果可能与实际情况不一致，混淆矩阵能清楚地展示这种差异。

什么是混淆矩阵？

混淆矩阵是一张矩阵表格，专门用来显示分类模型的预测结果与真实结果之间的对应关系。它通常用于二分类任务，也可以推广到多分类问题中。

混淆矩阵中的四个关键元素（针对二分类问题）：

真阳性 (True Positive, TP)：模型预测为“正”（例如有疾病），且真实情况也是“正”。

例如，实际有心脏病的患者被正确预测为患病。

真阴性 (True Negative, TN)：模型预测为“负”（例如没有疾病），且真实情况也是“负”。

例如，实际没有心脏病的患者被正确预测为健康。

假阳性 (False Positive, FP)：模型预测为“正”，但真实情况是“负”。

例如，实际上没有心脏病的患者被错误地预测为有病。

假阴性 (False Negative, FN)：模型预测为“负”，但真实情况是“正”。

例如，实际上有心脏病的患者被错误地预测为没有病。

解释这四个概念的应用：

真阳性 和 真阴性 代表模型的正确预测。
假阳性 和 假阴性 则是模型预测错误的部分。

如何构建混淆矩阵

假设我们有一组医疗数据，记录了患者的临床测量结果（如胸痛、血液循环、体重等），我们的目标是通过机器学习算法（如随机森林或 K 最近邻算法）来预测这些患者是否会患上心脏病。

我们需要以下步骤来构建混淆矩阵：

数据准备：将数据集分为训练集和测试集。训练集用于训练模型，测试集用于评估模型。
训练模型：选择不同的算法（如随机森林、KNN、逻辑回归等），并在训练集上训练它们。
预测与评估：使用训练好的模型对测试集进行预测，并生成混淆矩阵以评估模型性能。

随机森林算法的混淆矩阵（示例数据）：

真阳性（TP=142）：模型正确预测为心脏病的患者数，即实际患有心脏病且被正确预测的患者数。
真阴性（TN=110）：模型正确预测为无病的患者数，即实际没有心脏病且被正确预测为健康的患者数。
假阳性（FP=22）：模型错误地将无病患者预测为有病，即健康患者被误诊为有病的患者数。
假阴性（FN=29）：模型错误地将有病患者预测为无病，即患病患者被误诊为健康的患者数。

这些数据帮助我们了解模型在哪些方面表现良好（正确分类）和哪些方面存在问题（错误分类）。

不同算法的混淆矩阵比较

通过对比不同算法生成的混淆矩阵，我们可以选择性能更优的模型。例如，假设我们还使用了 KNN法 来进行预测，并生成了如下的混淆矩阵：

从该矩阵中可以看出：

KNN算法的 真阳性 和 真阴性 的值都较低，这意味着它对心脏病的预测效果不如随机森林算法。
随机森林在预测有心脏病患者时表现更好（142 对比 107），在预测无心脏病患者时也更准确（110 对比 79）。

通过这些对比，我们可以发现随机森林在这个案例中比 KNN算法表现更好。

多分类任务中的混淆矩阵

混淆矩阵不仅适用于二分类问题，也可以扩展到多分类问题。假设我们现在有一个电影推荐系统，用户需要选择自己最喜欢的电影。可能的选择有三部电影：“无间道”、“流浪地球”、“哈利波特”，并且模型需要预测用户最喜欢的电影是哪部。

如果模型可以预测三个类别（假设为“电影A”、“电影B”、“电影C”），那么混淆矩阵将扩展为 3x3 的形式：

与二分类任务类似，对角线上的数字代表正确的预测结果，而非对角线的部分则是模型的错误分类。随着分类数量的增加，混淆矩阵的维度也会增加。

总结

混淆矩阵的定义：混淆矩阵是用于总结分类模型预测结果与真实标签的工具，帮助我们了解模型的表现。
应用范围：混淆矩阵广泛应用于二分类、多分类任务。通过矩阵，我们能够快速识别模型的正确分类和错误分类。
优势：它清晰地显示了模型的分类性能，能够让我们直观地看到模型的弱点（如假阳性、假阴性）。
局限性：仅使用混淆矩阵有时难以确定模型的最终优劣，需要结合其他指标（如准确率、召回率、F1分数等）进行更全面的评估。

参考文献

Kohavi, R. (1995). A study of cross-validation and bootstrap for accuracy estimation and model selection. Proceedings of the 14th International Joint Conference on Artificial Intelligence.

Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters, 27(8), 861-874.

Provost, F., & Fawcett, T. (2013). Data Science and its Relationship to Big Data and Data-Driven Decision Making. Big Data, 1(1), 51-59.

Powers, D. M. W. (2011). Evaluation: From precision, recall and F-measure to ROC, informedness, markedness and correlation. Journal of Machine Learning Technologies, 2(1), 37-63.

Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427-437.

Chicco, D., & Jurman, G. (2020). The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation. BMC Genomics, 21(1), 6.

Han, J., Pei, J., & Kamber, M. (2011). Data Mining: Concepts and Techniques. Elsevier.

Dietterich, T. G. (2000). Ensemble methods in machine learning. International Workshop on Multiple Classifier Systems, 1-15.

Davis, J., & Goadrich, M. (2006). The relationship between Precision-Recall and ROC curves. Proceedings of the 23rd International Conference on Machine Learning (ICML).

Friedman, J., Hastie, T., & Tibshirani, R. (2001). The Elements of Statistical Learning. Springer Series in Statistics.

http://mp.weixin.qq.com/s?__biz=MzI0NTU2NzAxNw==&mid=2247486503&idx=2&sn=2ce36e37c6d95e964a59472ee30681d7

Dr Leo

ENT医生的科研分享

最新文章

T细胞反应的五个阶段

从不会到不怕——用R语言搞懂高斯朴素贝叶斯

一文搞懂ATAC测序

从不会到不怕——朴素贝叶斯

一文搞懂VEGF通路

从不会到不怕——用R语言搞懂t-SNE

独占鳌头！ 95后研究员连发三篇国际顶刊！引爆学术界核弹！

一文搞懂TGF-β信号通路

从不会到不怕——K-means聚类

一文搞懂细胞周期检查点

一文搞懂Cyclin和CDK

从不会到不怕——用R语言搞懂PCA

一文搞懂ddPCR

Toll-Like Receptor (TLR) 信号通路

从不会到不怕——用R语言搞懂Logistic回归

一文读懂IL-2

一文搞懂 IL-6

从不会到不怕——利用线性模型进行T检验和方差分析 (ANOVA)

一文搞懂中性粒细胞外陷阱

从不会到不怕 —— 多元回归

一文搞懂 IL-1

从不会到不怕——线性回归

一文搞懂干扰素

从不会到不怕——多基因风险评分

一文搞懂 RNA interference(RNAi)

你真的搞懂了ROC和AUC吗？

肥大细胞与肿瘤的互作

抗体依赖的细胞介导的细胞毒性（ADCC）

“四两拨千斤”的小分子——趋化因子

《Nature Reviews Genetics》合集——基因组学中的机器学习

“混血”免疫细胞 —— NKT细胞

机器学习基础 —— 混淆矩阵

机器学习基础 —— 交叉验证

一文搞懂共聚焦显微镜

机器学习入门 —— 引子

关于Th2细胞你需要知道这些

DNA损伤反应及修复

关于Th1细胞你需要知道这些

关于Th17细胞你需要知道这些

T细胞全家福：T细胞亚型

一文读懂二代测序（NGS）

善变的免疫细胞 —— 巨噬细胞极化

巨噬细胞亚型 —— M1 vs M2

史上最强！青年博士耗时多年，破解医学领域3大难题！无不称奇！

T细胞分化的前世今生

T细胞激活的三大信号及调控

一文搞懂蛋白质组学

一文搞懂流式细胞术pro

qPCR，你真的懂吗？

药效评价密码——IC50值（文末附绘图代码）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉