2009年,图灵出版了著名数学物理学家,圣路易斯华盛顿大学和斯坦福大学教授,统计力学和概率统计推断方面权威埃德温·汤普森·杰恩斯的最重要的代表作《概率论沉思录》的英文版。
引来众多数学专业人士的交口称赞,至今保持着豆瓣9.4的高分。被称为“一本至今尚无中译本的神书”。而现在,这本著作的中文版,终于在本科毕业于清华大学物理系,并在北京大学获得空间物理学硕士学位的廖海仁的努力翻译下正式出版了!
概率论作为逻辑的延伸,是所有科学推断的基础。本书收集了概率统计的各种线索,将概率和统计推断融合在一起,用新的观点生动地描述了概率论在物理学、数学、经济学、化学和生物学等领域中的广泛应用,尤其是阐述了贝叶斯理论的丰富应用,弥补了传统概率论和统计学的不足,并揭开了众多悖论背后的玄机。
《概率论沉思录》既是一本数学书,也是一本科学哲学书,还可以被看作一本逻辑学书,甚至一本生活智慧书,可以帮助我们更好地认识这个世界并且更好地生活。本书专注于概念的详尽解释,提供大量生活实例和常识的解读,也讲述了概率统计的历史脉络和广泛应用。
我们在此汇集了在整本书中使用的各种数学约定的简要说明,并讨论在概率论中出现的一些基本数学问题.在最近的文献中,粗心的记号已经导致了很多错误结果.我们需要找到合适的记号和术语的使用规则,使得人们不容易犯此类错误.
数学记号,就像语言一样,本身并不是目的,而只是一种交流的工具.如果允许记号像语言一样随着使用而演变,那将是最好的.这种演变通常是采用缩写形式,可以在根据上下文了解其含义时减少符号的数量.
但是,一种鲜活、不断变化的语言仍然需要语法与拼写形式的一套固定规则作为避风港.这些规则隐藏在字典中,在可能存在歧义时使用.同样,概率论需要一套固定的规范规则,我们在有疑问时需要依靠这些规则.这里会陈述形式记号规则和逻辑层次结构,从第 3 章开始的所有章节都遵从这些标准记号形式,并由此演化.在某一章中方便甚至几乎是必需的符号却可能在另一章中引起混淆,所以每个单独的主题必须允许从标准记号开始独立演变.
B.1 记号和逻辑层次结构
在我们的形式概率符号(大写 P 表示的那些)
P(A|B) (B.1)
中,A, B 始终代表命题.这些命题(至少对我们而言)具有足够清晰的含义,以至于我们愿意将它们作为服从布尔代数的亚里士多德逻辑的元素.因此,P(A|B)并不是通常意义上的“函数”.
我们再次强调:如果条件 B 在我们问题的背景中碰巧具有零概率(例如,B =CD,但 P(C|D) = 0),概率符号是未定义且没有意义的.认识不到这一点可能会导致错误的计算——正如无意中除以一个恰好是 0 的表达式可能会使所有后续结果无效.
为了保持概率符号 (B.1) 的纯粹性,我们还必须有其他符号.因此,如果命题 A 具有意义
A ≡ 变量 q 具有特定值 q′, (B.2)
那么通常就不写成 P(A|B),而是倾向于写成
P(q′|B). (B.3)
但 q′ 并不是一个命题,所以作者显然想用 (B.3) 代表一个变量 q′ 的普通数学函数.但是在我们的符号系统中,这是不合法的.如果想表示普通数学函数,我们将小心地使用一个不同的函数符号,比如 f( | ),将符号 (B.3) 写成
f(q′|B). (B.4)
区分符号 (B.3) 和 (B.4) 在某些读者看来可能有些迂腐,但是我们为什么要这样坚持呢?许多年前,我也会认为这一点太琐碎,不值一提.但是后来的经验表明,未清晰地加以区别会导致许多人进行错误计算并得出错误结论.这浪费了大量的时间和精力——而且这种浪费仍在概率论领域中发生——因此我们有必要采取措施来防止它重演.
关键是命题 A 可能确实指定某个变量 q 的值,也通常包含限定语句的陈述:
A ≡ 如果命题 B 为真,则变量 q 的值为 q′. (B.5)
如果尝试在概率符号中简短地用 q′ 代替 A,就会忽略限定语句.在后面的计算中,相同的变量 q′ 可能出现在具有不同限定语句 B1 的命题中,人们可能会再次试图用概率符号中的 q′ 替换.后来,同样的概率符号会出现两种不同的含义,人们会误以为它们代表相同的量.
这就是著名的“边缘化悖论”中发生的事情,其中相同的概率符号用来表示两个不同先验信息为条件的概率,并得出杰恩斯(Jaynes,1980) 和第 15 章中描述的奇怪结果.这种混淆仍然会给那些尚未理解概率论的人造成麻烦.
但是,我们对这种记号法并不执着.在几乎没有错误危险的简单情况下,我们允许做一定的妥协并遵循大多数作者的习惯,即使它不是严格一致的记号.在带有小写 p 的概率符号中,我们将允许参数是命题、数字或者二者的任意组合:因此,如果 A 是命题,q 是数,则等式
p(A|B) = p(q|B) (B.6)
是被允许的.但是要注意,当使用小写 p 符号时,读者必须根据上下文判断它的含义,并且有可能因未能正确区分而出错.
一个常见且有用的习惯是使用希腊字母表示概率分布中的参数,使用相应的拉丁字母表示数据的相应函数.例如,可以用 µ = ⟨x⟩ = E(x) 表示概率均值(概
率分布的平均值),而数据的平均值将是
.我们坚持这一点,除非会由于与其他一些习惯用法相冲突而造成混淆.
B.2 我们的“谨慎”策略
从第 2 章中根据对合理性和一致性的简单合情条件导出的概率论规则适用于离散、有限的命题集合.因此,有限集合是我们的安全港湾,其中考克斯定理适用,并且没有人能从应用加法规则和乘法规则中产生不一致性.同样,在初等算术中,有限集合是安全港湾,没有人会通过应用加法和乘法运算产生不一致性.
我们一旦试图将概率论扩展到无限集合,就需要在数学上保持谨慎,就像人们从有限算术表达式扩展到无穷级数时那样.第 15 章开头的“室内游戏”的例子表明,将在有限集合上总是安全的初等算术运算与分析操作应用到无限集合上,是多么容易犯错误.
在概率论中,目前已知的唯一安全流程似乎是先通过将概率论规则严格应用于有限命题集合来推导出结果,然后在有限集合结果摆在我们面前之后,观察它在命题数量无限增加时的表现.基本上有以下三种可能.
(1) 它平滑地趋于一个有限的极限,有些项变得越来越小并消失,留下了一个更简单的解析表达式.
(2) 它会爆炸,即在极限时变为无限大.
(3) 它保持有界,但是会永远振荡或波动,从不趋于任何确定的极限.
在情况 (1) 下,我们说极限是“行为良好的”并接受极限是无限集合的正确解.在情况 (2) 和 (3) 下,该极限是“病态的”,不能被视为问题的有效解.这时我们从根本上拒绝取极限.
这就是“三思而后行”的策略:原则上,只有在验证极限行为良好后,我们才会取极限.当然,这并不意味着我们在实践中对每一个问题都会重新进行这样的检验.大多数情况会反复出现,标准情况的行为规则可以一劳永逸地使用.但是如果有疑问,我们别无选择,只能重新检验.
在极限行为良好的情况下,可以通过直接对无限集合运算来获得正确答案,但是我们不能指望这一定可行.如果极限是病态的,那么任何直接在无限集合上解决问题的尝试都会导致无意义的结果.如果我们只看极限而不是取极限的过程,则无法看出其原因.第 15 章中提到的悖论说明了这方面的粗心大意所导致的一些恐怖后果.
B.3 威廉·费勒对于测度论的态度
与我们的策略相反,概率论的许多论述从一开始就试图在可数或不可数的无限集合上分配概率.那些使用测度论的人实际上是假设在引入概率之前已经完成了到无限集合的途径.例如,费勒提倡这一策略,并在其著作(Feller,1966)的第二卷中使用它.
在讨论这一问题时,费勒(Feller,1966) 指出,各种应用领域的专家有时“否认需要测度论,因为他们不熟悉其他类型的问题,以及模糊推理确实导致错误结果的情况”.如果费勒知道这样的事情的任何示例,那么肯定会说明——但是他没有.因此,正如他所说,我们仍然没有发现错误结果是由于未使用测度论的情况.
但是,正如第 15 章中特别指出的,在许多可记录的示例中对无限集合的粗心使用导致了荒谬的结果.我们还没发现我们的“谨慎”策略会导致不一致、错误,或者未能产生合理结果的情况.
我们不使用测度论的符号,因为它预设在推导开始时已经完成了无穷极限的途径——无视第 15 章开始引用的高斯的建议.我们经常在推导结束时取无穷极限,实际上是在直接使用“勒贝格测度”的原始含义.我们认为未能使用当前的测度论符号并不是“模糊推理”,恰恰相反,这是是否以正确次序做事的问题.费勒确实不情愿地承认了我们的立场是正确的.虽然他认为从有限集合过渡到明确定义的极限是不必要的,但是他承认它“在逻辑上无可挑剔”并且具有“对于初学者来说是一个很好的练习”的优点.这对我们来说已经足够了,因为在这个领域,我们都是初学者.也许最需要学习的初学者是那些拒绝这种非常有指导意义的练习的人.
我们还注意到,测度论并不总是适用的,因为并非所有出现在实际问题中的集合都是可测的.例如,在许多应用中,我们希望为事先知道是连续的函数分配概率.但是马克·卡克(Mark Kac,1956) 指出存在不可测的连续函数,它的内测度为 0,外测度为 1.作为数学家,他愿意牺牲现实世界的某些方面,以符合这一集合应该可测的先入之见.因此,为了得到一个可测函数类,他将其扩展到包括处处不连续的函数.但是,由此产生的测度“几乎完全”集中在这些处处不连续的函数类上.出于物理原因,我们强烈要求从我们的集合中排除这些函数!因此,虽然卡克得到了令他满意的解,但这并不总是真正问题的解.
我们的价值判断恰恰相反:关注现实世界.我们愿意牺牲关于可测类的先入之见,以保留现实世界中对我们的问题很重要的方面.在这种情况下,我们的谨慎策略的某个形式将始终能够绕过测度论以获得我们寻求的有用结果.例如,(1) 在有限数量的 n 个正交函数中展开连续函数;(2) 在有限维空间 Rn 中为展开系数分配概率;(3) 做概率计算;(4) 最后传递到极限 n → +∞.在一个实际问题中,我们发现将 n 增加到超过某个值会使我们的结论发生数值上可忽略的变化(即如果我们正在计算有限数量的小数位,严格来说变化为 0).所以我们终究从不需要脱离有限集合.在从统计力学到雷达侦测的各种应用中,都可以通过这种方式找到有用的结果.
在我们看来,计算中出现的大多数(也许是全部)无限集合悖论是由过早地过渡到无穷极限的倾向造成的.通常,这意味着至关重要的信息在我们有机会使用之前就丢失了,第 15 章中的非聚集性的情况就是一个很好的例子.无论在何种情况下,无论原因是什么以及有什么补救方法,我们的观点都是,无限集合悖论属于无限集合理论领域,在概率论中没有立足之地.我们对自己施加限制,只考虑有限集合及其良好极限,这使得我们能够避免最近统计文献中出现的所有无用和不必要的悖论.根据这一经验,我们推测概率论中的所有正确结果可能都是有限集合上的组合定理或它们的良好极限.
但是在这个问题上,我们也不狂热.我们认识到:集合论和测度论的语言是术语上的一个有用发展,在某些情况下使人们能够一般、简洁地陈述数学命题,这在 19 世纪的数学中是相当缺乏的.因此,只要它有助于我们的目标,我们就很高兴使用这种语言.如果不偶尔使用“几乎所有”或“零测度”这些术语,我们几乎无法前行.然而,当我们使用一点儿测度论时,从来没有想过这会使论证更加严格,而只是承认该语言的简洁性.
当然,我们随时准备并且愿意使用集合论与测度论——就像我们准备并且愿意使用数论、射影几何、群论、拓扑学或任何其他数学分支一样——只要这对于找到或理解结果有所帮助.但是,我们认为没有必要使用集合论与测度论术语和符号陈述每个命题,特别是在使用简单的语言更清晰的情况下.而且据我们所知,对我们的目的而言,使用简单的语言会更有效,而且实际上更安全.
事实上,坚持对所有数学知识始终用术语表述可能会给理论带来不必要的负担,尤其是对于一种旨在应用于现实世界的理论.这也可能会显得比较造作,只有语言上的作用,而不具有实际功用.给每一个我们熟悉的旧概念一个高斯和柯西不知道的新的令人印象深刻的名字和符号与严格无关.它通常是一种花招,真正目的是隐藏正在做的本质上平凡的事情.用简单的语言陈述它会使人觉得脸红.
B.4 克罗内克与魏尔斯特拉斯的比较
说到这里,读者心中肯定会有一个疑问.我们强调有限集合的安全性,似乎整个数学分析(一切都是在不可数集合上进行的)都是值得怀疑的.让我们解释一下为什么事实并非如此,以及为什么我们对柯西和魏尔斯特拉斯的数学分析充满信心.
19 世纪后半叶,卡尔·魏尔斯特拉斯(1815 1897)和利奥波德·克罗内克(1823 1891)都在柏林大学讲授数学.他们之间形成了一种差别,这种差别被后来的评论家大大夸大了.直到最近几年,他们之间关系的真相才开始浮出水面.
简而言之,魏尔斯特拉斯致力于完善分析工具(尤其是幂级数展开),时刻不忘应用于椭圆函数的具体例子.克罗内克更关心数论的数学基础,并质疑不从整数开始进行推理的有效性.表面上,这似乎否定了所有美好的数学分析结果.莫里斯·克莱茵的书(Kline,1980)给人的印象也是,克罗内克的苦行主义否定了现代数学中的一些重要进展.但是这种记录其实歪曲了事实.
例如,贝尔(Bell,1937,第 568 页)将魏尔斯特拉斯描绘成伟大的数学分析大师.他对柯西的工作进行了最后的补全,而克罗内克则只是一只牛虻,攻击魏尔斯特拉斯所做的一切工作的有效性,但是没有做出任何积极的贡献.克罗内克确实至少有一次曾经惹恼了魏尔斯特拉斯,这在魏尔斯特拉斯的信件中有所记载.然而,他们在原则上并没有真正的冲突.要了解他们的观点,我们需要一位比贝尔更好的证人,幸运的是,我们有两位:亨利·庞加莱和哈罗德·爱德华兹.
1897 年魏尔斯特拉斯去世时,庞加莱写了一篇对他的数学工作的总结(Poincaré,1899),其中指出:“……所有作为分析对象以及处理连续量的方程只不过是符号,取代与整数相关的无限不等式集合.”用爱德华兹(Edwards,1989)的话来说,“……魏尔斯特拉斯和克罗内克的数学都完全基于整数,因此他们所有的工作都以算术的确定性为基础”.爱德华兹还指出,通常归于克罗内克的一些保守观点只是道听途说,在克罗内克自己的话中找不到支持证据.
例如,贝尔(Bell,1937,第 568 页)告诉我们(这没有任何文献支持)克罗内克在听到林德曼关于 π 是超越数的证明时,问这有什么用处,因为“……无理数并不存在”.可以明确的事实是克罗内克自己关于数论方面的工作(Kronecker,1901,第 4 页)将莱布尼茨公式
(B.7)
描述为“关于奇数最优美的算术性质之一,即确定了这个几何无理数”.显然,克罗内克认为无理数至少具有足够的“存在性”以允许它们被精确定义.的确,他并不认为无理数是数学基础的必要组成部分.事实上,鉴于像上面那样允许完全用整数来定义无理数,他或者其他人怎么会认为无理数是基础的必要组成部分呢?
奇怪的是,魏尔斯特拉斯也以同样的方式根据整数定义了无理数.那么他们之间的区别在哪里呢?
克罗内克和魏尔斯特拉斯之间的区别是审美上的而不是实质性的:克罗内克希望始终保持第一原则(起源于整数),而已经做了新构造的魏尔斯特拉斯想忘记其构造步骤,并将其用作进一步构造的元素.用现代计算机术语来说,魏尔斯特拉斯并没有否认克罗内克关于所有数学的“机器语言”基础的思想,而是想用更高级的语言发展数学分析.爱德华兹指出克罗内克的原则“……在他的思想中以及事实上,与他的前辈们——从阿基米德到高斯——的原理没有什么不同”.
幸亏有爱德华兹的历史研究,真相开始浮出水面,克罗内克被证明是无辜的且被恢复名誉.或许克罗内克过于狂热,或许他误解了魏尔斯特拉斯的立场,但从那以后的一系列事件表明他对自己的事业不够狂热.他未能回应乔治·康托尔(1845 1918)似乎很不幸,但是很容易理解.
对克罗内克来说,康托尔的想法太离谱了:它们与数学无关,数学家们没有理由关注它们.如果数学期刊的编辑们犯错误出版了这些东西,那是他们的问题,而不是他的问题.但是克罗内克的通信中确实包含了一些非常重要的真理,特别是,他抱怨说,集合论的大部分内容是幻想的,因为没法算法化(即不包含可以构造给定元素或者通过有限步骤的操作决定给定元素是否属于给定集合的规则).
今天,以我们的计算机思维,这似乎是陈词滥调,很难想象有人会忽视它,更不用说否认它了.但是这正是已经发生的事情.我们认为,如果数学家们更加关注克罗内克的这一警告,今天的数学可能会更健康.
B.5 我应该发表什么?
萨维奇(Savage,1962)曾经用这个问题表达了他的困惑.无论他选择讨论什么话题,采用什么写作风格,都肯定会因为没有做出不同的选择而受到批评.在这一点上,他并不孤单.我们希望呼吁对个体差异多一点儿宽容.
如果有人想把注意力集中在无限集合、测度论和一般的数学病理学上,他完全有权这样做.他不需要通过列举出相应的应用为之辩护或者为实际应用的缺乏而道歉.正如好久以前我们就已经意识到的那样,抽象数学有其自身的价值.
但是反过来,其他人也拥有同等的权利.如果我们选择专注于数学中那些在实际问题中有用并且我们能够正确地进行重要计算的方面——数学病理学家可能从来没有考虑过——我们可以自由地这样做而无须道歉.
最后,本书对数学层次和深度的选择,目的是让所有读者都能从中提取他们想要的东西.由于那些以挑剔风格为唯一目的的人总是能够这样做,我们的目标是确保那些真诚希望理解其内容的人也可以这样做.因此,我们试图给出令人信服的理由,说明为什么我们提出的想法是“显而易见的”,而我们批评的则不是,只要这样做足够简短,不会打断论证主线.这会不可避免地留下一些空白,部分由大多数章节末尾的评述填补.
在这方面,什么是或不是“显而易见”的问题是两个方向相反的技巧问题.一方面,引入经不起批判的概念——或者贬低那些站得住脚而无可辩驳的概念——的标准方式就是称其为“显而易见的”.另一方面,对显而易见的简单问题表示严重怀疑,则是将自己的深刻批判能力求全于不具备如此批判能力的其他人的标准技巧.我们试图在这两者之间选择一条中间路线,但是就像萨维奇一样,我们知道无论我们做出什么选择,都会受到其中一种类型读者的批评.
我们要避免一个常见的错误:没有什么比某个领域的作者声称数学严格性“保证了结果的正确性”更可悲的错误了.相反,经验告诉我们,越是专注于表面上的数学严格性,人们对现实世界中前提的有效性就会关注得越少,也就越有可能得出在现实世界中荒谬的最终结论.
推荐阅读
《概率论沉思录》
作者:埃德温·汤普森·杰恩斯
译者:廖海仁
著名数学物理学家,圣路易斯华盛顿大学和斯坦福大学教授,统计力学和概率统计推断方面权谋埃德温·汤普森·杰恩斯,40年思想著作;
无数读者苦等15年的概率论神作,英文版豆瓣评分9.4高分;
概率论作为逻辑的延伸,是所有科学推断的基础。本书收集了概率统计的各种线索,将概率和统计推断融合在一起,用新的观点生动地描述了概率论在物理学、数学、经济学、化学和生物学等领域中的广泛应用,尤其是阐述了贝叶斯理论的丰富应用,弥补了传统概率论和统计学的不足,并揭开了众多悖论背后的玄机。
02
《贝叶斯的博弈》
作者:黄黎原
译者:方弦
法国数学类科普书、大学数学参考及教材类图书畅销书目,在机器学习、人工智能、逻辑学和哲学等众多领域中,探索贝叶斯定理蕴藏的智慧与哲理。
贝叶斯定理一旦与算法相结合,就不再是一套枯燥的数学理论或认识论,而变成了应用广泛的知识宝库,催生了众多现代数学定理,以及令人称道的实践成果。
03
《趣学贝叶斯统计》
本书用十余个趣味十足、脑洞大开的例子,将贝叶斯统计的原理和用途娓娓道来。你将从直觉出发,自然而然地习得数学思维。读完本书,你会发现自己开始从概率角度思考每一个问题,并能坦然面对不确定性,做出更好的决策。