决策本质是熵减

文摘 2024-09-07 11:30 上海

在我们日常生活中，选择无处不在。比如早晨选择穿什么衣服，去公司乘坐什么交通工具，抑或是浏览公众号文章时读哪篇文章，这些寻常的行为背后，其实都隐藏着深刻的信息论概念。

信息论，作为现代数学和计算机科学的重要分支，主要研究信息的获取、传递和处理，而其中一个核心概念就是“熵”。

熵最早是热力学中的概念，用来描述一个系统的无序程度。而在信息论中，熵则代表了系统中不确定性的量度。换句话说，熵越大，系统中的不确定性就越高；熵越小，不确定性就越低。

当我们做出选择时，实际上是在减少不确定性，也就是在“熵减”。本文将带您从信息论的角度，谈一谈“选择”这一行为的本质。

什么是信息熵？

信息论中的熵是由克劳德·香农在1948年提出的。他定义了熵作为一个随机变量的不确定性度量。在信息论的背景下，信息熵描述了一个事件发生前的不确定性。如果一个事件完全确定（即不可能发生其他情况），那么它的熵就是零；如果一个事件存在多个可能的结果，而且这些结果的发生概率相等，那么它的熵就较大。

香农的熵公式如下：

其中，表示随机变量的烠，表示事件发生的概率，表示对数运算。这个公式告诉我们，事件的概率越接近于1（即事件越确定），它所包含的不确定性（熵）就越小；而事件的概率越分散（即越不确定），它的熵就越大。

打个比方，当你掷一枚完全均匀的硬币时，它有两个可能的结果：正面或反面。这两个结果的发生概率都是 0.5，因此这枚硬币的熵可以计算为：

这时掷硬币的结果不确定性较大（其实是两种情况下的最大值），熵值为1比特。而如果这是一枚很奇怪的硬币，不管怎么扔，总是出现正面，那么熵就是0，因为结果是完全确定的。

选择与熵减

在生活和工作中，做出选择的过程其实就是减少不确定性的过程，也就是信息论中的“熵减”。当我们面对多种可能的选择时，系统的不确定性较大，熵值也较高。而当我们做出选择后，结果变得更加明确，系统的不确定性减少，熵值随之下降。

比如，你在一个餐厅的菜单上看到10种不同的菜，每种菜都有相同的概率被你选择。根据信息论的熵公式，这一情景的熵是：

而当你最终选择了一道菜，比如说选择了“锅包肉”，此时熵下降到了0，因为你的选择已经明确，不再存在不确定性。这就是选择导致熵减的一个简单例子。

去餐馆时当我做不出选择的时候，我一般会问店员：招牌菜有什么？店员会列出一个或几个，这时候我选择的空间就变小了，信息熵就会随之减少。这种情况下，店员提供的建议实际上起到了信息过滤的作用，将原本10个选择的高熵状态降低到了只有几个选项的不确定性较低的状态。

选择与信息增益

除了熵减，信息论中还有一个重要的概念叫“信息增益”（Information Gain）。信息增益描述的是通过观察或获取信息，系统中的不确定性减少的量度。信息增益本质上就是熵的减少量。

常用来解释熵概念的是猜数游戏，比如对方选择了一个从1到100之间的数，而你需要通过一系列问题来猜这个数。如果你每次只能问对方“这个数是否大于某个值”这样的问题，那么你最优的策略就是每次把可能的范围对半分。例如，第一次可以问“这个数是否大于50”，这会把可能的范围缩小一半——要么在1到50之间，要么在51到100之间。这个过程通过信息增益减少了系统的不确定性。

信息增益也被用在决策树和机器学习算法中。

选择与自由意志

选择是人类行为的核心之一，而信息论为我们提供了一个新的视角来理解选择：每一次选择其实都是在对系统进行熵减，减少不确定性。

我们常常把自由意志视作一种自主选择的能力，而在信息论的框架下，自由意志可以理解为对高熵状态下的自主决定。通过选择，我们从混沌和不确定性中抽离出明确的路径，降低系统的熵。

当然，并不是所有的选择都会带来真正的熵减。在某些情况下，我们做出的选择可能只是表面上的多样性，实际并未带来不确定性的减少。这种表面上的选择，虽然看似提供了多样性，实际上可能没有真正增加信息的价值。

我们可以通过信息论的概念来更好地理解这种现象。例如，在面对形式多样但实质相同的选项时，我们的选择并没有带来显著的熵减，因为每个选项之间的差异性不足以减少系统的不确定性。这个过程类似于“伪选择”，它仅仅是一些表面上的差别，无法为系统带来真正的信息增益。

选择与优化

在很多情况下，选择不仅仅是一个简单的熵减过程，它往往涉及优化。例如，当我们在众多选项中寻找最佳解决方案时，我们希望不仅仅是减少不确定性，还要找到使得结果最优的选择。在这种情况下，选择不仅要考虑减少熵，还要引入其他因素，如效用、成本等，来平衡不确定性和资源消耗。

信息论为此提供了一个称为“压缩”的概念，即通过尽可能少的信息传递尽可能多的有效信息。压缩的本质是通过最优选择减少系统的冗余信息。例如，霍夫曼编码就是一种基于信息熵的压缩算法，通过对概率分布进行最优选择，减少数据的冗余部分。

总而言之，从信息论的角度看，每一次选择，都是一次不确定性的消解，也是我们在复杂的世界中寻找确定性的必经之路。在这个信息爆炸的时代，或许我们真正需要学习的，不是减少选择，而是如何通过选择减少熵、提升信息的价值。（作者：王海华）

http://mp.weixin.qq.com/s?__biz=MzAxMTYzNTA2Ng==&mid=2653695807&idx=1&sn=0babedf42353872e403d2bd468fbe12f

模型视角

一个资深数学建模爱好者的知识、视角和建模乐趣分享！主理人：王海华，数学建模教师，著有《模型，就是数学化的思维》《数学建模实战：手把手教你参加数学建模竞赛》，参编《数学建模：教学设计与案例》《高中STEM精品课程资源课例》等。

最新文章

数据可视化的9大原则及案例分析

真正厉害的人，这种思维都很强大！

人际冲突的数学：价值、利益与噪声

生活中的非线性思维

期待与期望：从统计学的角度管理预期

读读欧拉，读读欧拉吧！他是我们所有人的老师！

什么是交叉熵损失函数？

追求快，尊重慢：来自指数函数的启示

996加班数学

决策本质是熵减

何谓“平衡”？

从电视剧《凡人歌》看：系统与图论

数学是发现还是发明？

数学，源于我们简化身边世界的渴望

费曼不怎么读书，也不怎么听讲，他想要的是自己动手的乐趣

层次分析法(AHP)背后的佩罗-弗罗贝乌斯定理

画的漂亮！用 LaTeX 绘制函数图、统计图与几何图

何为微积分？

数学追凶：3个有趣的数学侦探故事

协调发展要看：耦合度与协调度模型

没有数据，我们如何做机理分析？

万物皆可向量

数学建模教育的飞轮会加速运转吗？

生物学中的四大数学模型

开放系统的人生启示

忽视统计学，就等于忽视科学

如何基于技术飞轮模型预测未来？

一个好的模型，有哪些特点？

爱，除了朱丽叶，还有傅里叶

如何在模型应用之前进行检验？

如何打好逆风局？来自数学的启示

为什么小学生会的题，而丘成桐不会？

我的假设，检验了么？

理解概率，拒绝内耗！

当你低落时，不妨想想导数

如何进行利益相关者分析？

最美的24个数学定理

巧妙应用第一性原理解决问题

认知的过程就像泰勒展开

看似简单的选择背后，其实隐藏着一个复杂的博弈过程

数学建模背后的哲学基础

哇，好可爱的统计学

七大启发式算法及人生哲理

理性决策最容易忽略的一点是什么？

蒙特卡洛树搜索算法与AlphaGo

全面整理人工智能(AI)学习路线图及资源推荐

解决复杂的人生问题，或许只需要一个简单的矩阵

简单的微分方程，道尽了人生真谛

最大特征值及特征向量在数学建模中的应用

我们在宇宙中的位置和意义是什么？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉