机器学习方法系列36——完结撒花！就用马尔可夫链画上句号叭！

文摘 2024-07-15 00:00 湖北

在自然语言处理（NLP）领域，有一个核心的机器学习模型被人津津乐道，那便是隐马尔可夫模型，该模型主要受到马尔可夫链（Markov Chain）的启发。

马尔可夫性质来自于马尔可夫链，大概意思就是：上一个事件的发生可以影响到下一个事件的发生概率。

举个例子，现在有一个渣男，他看到女生只会说三句话，分别是“A：小姐姐”，“B：你真好看”和“C：加个微信好吗？”。现在我们用分别用 ABC 来代表这三句话。我得告诉你，渣男下一句话要说什么取决于他上一句话说了什么。如果他说了一句“小姐姐”，下一句有一定的几率说“你真好看”，当然也可能是再说一遍“小姐姐”，但只要他说出了“你真好看”这句话，下句百分百接上“加个微信好吗”这句万恶源泉。如果用有向图表示出来的话，渣男的行为模式就长这样：

这就是一个很典型的马尔可夫链了。图中分别表示渣男可能说的那三句话，箭头和数字则分别表示说完这句话后下一句可能说什么以及说那句话的概率是多少。由图可见，对于马尔可夫链而言，下一个事件的概率分布完全由该随机变量当前所处的状态决定，而且与历史无关。

好的，下面笔者要开始专业的描述了。如上图中的每个结点（A、B、C）可以理解为某一时刻的状态，箭头代表转移方向，数字代表转移概率。如，状态A接下来将转移至状态B的概率是0.9。注意，这个转移概率反映的就是单纯的从A转移至B的概率。换句话说，转移至B状态的概率只由它的上一个状态A来决定，与之前的任何一种状态都无关！这句话描述成公式如下：（其中St可以抽象为某事物在第t时刻的状态， $S_{1},S_{2},...,S_{t-1}$ 是一个离散的自然序列） $P(S_{t}|S_{1},S_{2},...,S_{t-1})\\=P(S_{t}|S_{t-1})$ 这为自然语言处理任务形成了天然的优势，也成为了统计语言模型的基本原理。这里就用一段话帮助大家粗浅的理解吧，也不进行深入讲解了。在处理如机器翻译、语音识别等任务时，机器想要理解语句，就必然进行分词。而统计语言模型就是在做一件事，帮助机器确定哪种分词方法最好（假设不考虑语义分歧），就是用概率的思想，哪个词出现的概率越高就选择哪个词。而处理自然语句时，机器也需要通过上下文理解。机器理解上下文的方式，便是通过第t-1个词，确定第t个词，无需考虑第t-1个词之前的所有词，这也正是上面这个公式的含义。

回到例子中，就算那个渣男明明已经重复了一百遍“加个微信好吗”都没有成功加到微信，只要让他逮到机会再说一次“你真好看”，他就敢再要一遍微信。

综上，马尔科夫链是马尔可夫过程与离散时间和离散状态空间。因此，马尔可夫链是一个离散的状态序列，每个状态都从一个离散的状态空间（有限或无有限）中提取的，并且遵循马尔可夫属性。用稍微更数学的术语来说，给定当前状态和过去状态的流程，未来状态的条件分布只依赖于当前状态，而完全不依赖于过去状态(无记忆属性)。具有马尔可夫属性的随机过程称为马尔可夫过程。

这里有感而发，大家共勉！笔者选择通过讲述马尔可夫链作为本合集的结尾，是因为人生就像一条马尔可夫链，我们无限可能的未来很可能只由每一个当下正在做的事情决定，而不是由之前已经取得的事决定(无记忆性)。

【笔者的话】

衷心感谢所有看到这里的友友们，希望大家可以给《师苑数模》公众号点点关注。完结的只是小小的机器学习合集，后续有更好的分享我们依然会通过公众号呈现给大家。

本合集基本包含了南京大学周志华教授所著的《机器学习》（西瓜书）的前九章的主要知识，（高等学校本科期间的课程也差不多就是掌握这些内容。西瓜书第九章以后的部分，南京大学用作人工智能学院大三上且列入保研NJUAI必须修读的《高级机器学习》课程材料使用。）合集里的内容算是笔者学习西瓜书以来的一些心得笔记，讲解肯定没有直接啃书本费劲，也算是可以帮助大家理解。其中错误肯定有很多，也非常欢迎大家通过公众号留言或者私信来反馈，笔者将感激不尽。

师苑数模

发布数模协会培训推文，讲解数模算法。赛题讲解及比赛通知。学校竞赛结果及学校竞赛成绩发布等文章。

最新文章

北太案例-利用北太天元竞赛版本求解2024年数学建模国赛B题第2，3问

零基础不本地安装怎么写latex-没关系我教你用overleaf写

2024年数学建模国赛B题快速复盘-思路简单分析

2024年中葡体育科学研讨会（足球科学训练）-参会感想（赠送体育大数据开源项目）

教师节快乐！写给每一个老师和布道师

2024年数学建模竞赛A,B,C题快速评价和国产工具使用反馈（含教学建议）

数学建模竞赛复盘要求和资源使用规范

机器学习第二次笔记-机器学习基础12问课后习题解答（考点建议收藏）

物联网基础第二次笔记-我赠送给同学们作业模板latex源码

大数据概论第二次笔记-好酷啊，数据可视化工具居然这么多！

马上就数学建模国赛了，请各位参赛同学检查自己的装备-北太天元，SPSSPRO和杉数求解器

2023年华为杯研究生数学建模竞赛C题代码分享-spsspro和杉数求解器启动

概率论与数理统计第二次笔记-分享两道例题

2024年数学建模高教社杯国赛要开始了，我帮同学们整理了往次比赛的开源代码（建议收藏）

Datawhale数学建模组队学习优秀笔记2024年8月

机器学习第一次笔记-学术要求和部分概念自学资料汇总

2022年数模国赛B题完整思路和部分代码分享-模拟赛优秀作品分享

划重点-大数据概论第一次课程笔记（怎么顺利毕业！）

优秀数模解题思路分享-2022年数模国赛C题玻璃题的完整思路代码分享

解题思路分享-2022年华中杯数模竞赛A题思路分析和完整代码分享

供应链推式与拉式：一块硬币的两面

澳门理工留学经验帖-选择合适的电话卡

参会感想整理-2024Hong Kong RISC-V Day +AI CON

直播回顾 | UIUC 赵梓硕：同伴预测机制在区块链共识与可信AI中的应用「OR Talk 31」

高级概率论与数理统计第一课-导论

物联网基础第一课-学习注意事项（含latex和华为物联网课程）

【Presolve (一)】整数规划预求解技术 Simple Probing 算法

分享一点物流公开课信息20240822

分享一点澳门留学更新想法-含留学生来澳门前需要准备的材料（入学和学术篇）

留学生活开始了，总结一点澳理工留学生活经验！（坐公交车）

写一写对布道师这个词的认识和想法，于是我计划......

第六届八一赛非数组A类填空题参考解答

Datawhale AI夏令营逻辑推理学习笔记Task2

我在Datawhale当助教系列-暑假组队学习开源博客写作指导-以数学建模组队学习为例

北太天元在《数值方法：原理、算法及应用》中的教学实践-记录观看的一点想法

杉数求解器-囚徒博弈问题（观看讲座对比北太天元，杉数求解器）

考研数学分析与高等代数学习总结

杉数求解器-多商品问题加强版本

杉数求解器-多商品问题的求解（数模玩家必看）

杉数求解器—尝试求解2024年亚太赛中文赛C题

Datawhale第三期AI夏令营喊你报名啦！！！

数学建模导论课程开课通知！

往届八一杯数学竞赛试题汇总

北太案例-利用北太天元求解2021年北京大学强基计划数论题

为什么国内学术界卷的飞起但工业界的技术仍然十分落后？

Datawhale第二期AI夏令营-机器学习-电力需求预测挑战赛尝试第三次-终于反击baseline

利用科大讯飞星火认知大模型求解2024年北京大学强基计划语文试题

北太案例-利用北太天元求解2024年北京大学强基计划真题

机器学习方法系列36——完结撒花！就用马尔可夫链画上句号叭！

机器学习方法系列35——使用朴素Bayes的新闻文档分类任务

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉