涌现的计算方法：从计算力学到层级涌现

科技 2024-11-26 16:09 北京

导语

什么是涌现？关于涌现是否存在一个形式化的计算方法？从默里·盖尔曼到P.W.安德森，许多科学家都探讨了复杂系统中的涌现现象。今天的文章选自意大利帕多瓦大学物理学教授、物理学家和复杂系统科学家 Manlio De Domenico 的博客，在文中，De Domenico 就因果涌现理论研究者 Fernando Rosas 的最新工作“涌现的计算方法”分别采访了 Rosas 和算法信息论专家 Hector Zenil。

关键词：复杂系统，涌现，因果，计算力学，算法信息论，层级结构

来源：集智俱乐部

作者：Manlio De Domenico

译者：杨明哲

编辑：梁金

学者简介

Manlio De Domenico，物理学家和复杂系统科学家，意大利帕多瓦大学物理学教授，网络药物学中心主任，地中海复杂网络学校主任。学者主页：

https://manliodedomenico.com/。

De Domenico 正在面向中国学生招收 PhD，方向为脑网络分析与建模。欢迎感兴趣的朋友关注，详情见今天二条文章。招生链接：

https://www.unipd.it/en/scholarships-chinese-phd-students

我们时常能看到一些令人着迷的现象。这些现象以高度结构化的集体行为为特征，自然地随着时间的推移从更基本的单元或子系统的相互作用中产生，而不需要外部施加的集中控制或协调。这种现象之所以迷人，是因为在不受最低层次运动方程支配的尺度上，新的机制或法则会自发地出现（详见后文）。从蚁群到鸟群，从金融危机到飓风，这些现象可以用著名的“整体大于部分之和”来概括。

什么是涌现？

这确实是一个很棒的问题。我通常会引用我的同事 Peter Dodds 的观点来给出第一个答案，他多年前给我提供了一首美丽的短诗，用以实证描述什么是涌现现象：

碳原子中没有爱，水分子中没有飓风，美元钞票中没有金融危机。——Peter Dodds《复杂性解释》

另一个有趣的观点来自默里·盖尔曼（Murray Gell-Mann）：

你不需要更多的东西来得到更多的东西。这就是涌现的含义。——M. 盖尔曼

虽然严格来说，我们并没有一个形式化的涌现理论，但在哲学上，它已经从亚里士多德关于物质实体的概念中显著发展起来。在那里，像人类心智能力这样的复杂属性被视为从更简单的物理元素中产生，但又与之不同。科学革命将亚里士多德的焦点转向了通过笛卡尔二元论的还原论范式，主张物质身体和非物质心灵之间的严格分离，同时倡导对物理现象的机械理解。

在19世纪，像约翰·斯图尔特·密尔（John Stuart Mill，《逻辑体系》（1859年）第六章“原因的组合”）和 C.D. 布罗德（《心灵及其在自然界中的位置》）这样的英国涌现论者通过论证复杂系统展现出的属性无法仅从其个别组成部分预测，从而让这一概念重新被关注。这种思维方式对抗了当时盛行的还原论趋势，表明这些属性是随附的但又自主的。最近关于这一主题的讨论，特别是在科学界，往往集中在这些涌现属性的本体状态上——它们是根本上的新实体还是可以通过基础物理法则完全解释的。在物理学、生物学和认知科学等领域，理解复杂系统的行为和属性的性质挑战了更简单的还原论解释，支持了一个更不可控、更动态的自然世界的观点。

在1972年，菲利普·安德森（Phil Anderson）在其著名的论文《More is Different》中主张，复杂系统展现出的属性和行为并不仅仅是它们各部分的总和，这表明物理学中的还原论方法不足以理解更高层次复杂性中的涌现现象。

心理学不是应用生物学，生物学也不是应用化学。——菲利普·安德森

在2000年，Laughlin 等人提出了“中间道路”的观点：

在软物质、硬物质和生物物质中，介观组织是在我们目前对（在非常大的粒子聚集体中长波长处）涌现组织行为（结晶性、铁磁性、超导性等）原理的理解的背景下进行考察的。

特别注意到尚未发现的组织原则可能在介观尺度上起作用的可能性，介于原子和宏观维度之间，以及它们的发现对生物学和物理科学的影响。寻找这种规则的存在性和普遍性，证明或反驳适用于介观领域的组织原则，被称为中间道路。

有许多专著致力于探讨涌现现象，以及弱涌现与强涌现之间的区别等议题。这里挂一漏万地展示其中一部分。

图1. 有关涌现现象的流行书籍和最近一期皇家学会的特刊。

两年前，我们尝试汇集来自不同学科的几位专家，共同应对从细胞到社会尺度描述涌现现象的挑战。其中我们努力回顾了量子物理系统、经典物理/非生命系统、生命系统和社会系统中的涌现现象。基于大卫·查尔默斯（David Chalmers）和马克·贝道（Mark Bedau）的基础工作，我们勾勒出了一个简化的形式化方法来表征涌现现象。

论文题目：From the origin of life to pandemics: emergent phenomena in complex systems
论文地址：
https://royalsocietypublishing.org/doi/10.1098/rsta.2020.0410
相关文章：从生命起源到流行病：复杂系统中的多尺度涌现现象

使用上述术语，我们可以为各种现象定义一个分类体系：

非涌现的：一个人对 LLMR（低层次规律）和 IC（初始条件）有所了解，使我们能够推导出预期的 HLP（高层次属性）；

弱涌现的：一个人对 LLMR 和 IC 有所了解，使我们能够通过计算（例如模拟）推导出意外的 HLP；

强涌现的：即使在原则上，对 LLMR 和 IC 的了解也不允许我们推导出 HLP。

这里的重点不是讨论弱涌现与强涌现的区别，而是关于找到一种形式语言的必要性，以便以建设性和可操作的方式进行讨论。

层次涌现的计算方法

在最近的一篇预印本论文中， Fernando Rosas 及其合作者通过分析软件的工作方式来探讨涌现现象，为这一持续努力做出了贡献。这种选择使他们能够利用一个形式的描述，来表达宏观过程如何表现出自包含的信息性、干预性和计算属性。

论文题目：Software in the natural world: A computational approach to hierarchical emergence
论文地址：https://arxiv.org/abs/2402.09090
相关文章：从生命到星系，新数学揭示大尺度秩序如何涌现

Fernando Rosas 在因果涌现读书会第五季的分享
整合信息分解框架提出者 Fernando Rosas：涌现现象的计算操作方法
https://pattern.swarma.org/study_group_issue/644

我向 Fernando 提出了一些问题，以帮助我更好地理解他们的研究。

De Domenico：您的论文在涌现方面相对于之前尝试的最根本进步是什么？

Rosas：我认为当前领域正在着手形式化涌现的不同“视角”。这有点像复杂性的情况：最初我们认为需要复杂性的“正确度量”，然后意识到复杂性意味着许多不同的事情，并进而形式化每一种。在这个意义上，这项工作属于试图使用信息论工具来表征时间序列中涌现现象的一系列努力之一。

本文与其他文献的一个关键区别在于，我们努力超越标量度量，通过更多的机制来表征涌现。我们的方法专注于探讨时间序列数据中给定尺度的“闭合”（closure）可能意味着什么。我们确定了“闭合性”的三个层面：

信息闭合：仅从宏观数据就可以构建最优预测，

因果闭合：对宏观有影响的每一次干预都可以在宏观层面进行，

计算闭合：通过粗粒化微观的计算可以识别出宏观的特征计算。

关键的理论贡献是形式化这些概念，并阐明它们之间的关系。我对在信号处理（预测）、因果发现（干预）和理论计算机科学（通过自动机模型的计算）之间建立的桥梁特别感到兴奋。

[1] Quantifying causal emergence shows that macro can beat micro
相关文章：《量化因果涌现表明：宏观可以战胜微观》
相关读书会：https://pattern.swarma.org/study_group_issue/79
[2] Reconciling emergences: An information-theoretic approach to identify causalergence in multivariate data
相关文章：《量化涌现：信息论方法识别多变量数据中的因果涌现》
相关读书会：https://pattern.swarma.org/study_group_issue/239
[3] Dynamical independence: Discovering emergent macroscopic processes incomplex dynamical systems
相关文章：《动力学独立性：在复杂动力系统中发现涌现的宏观过程》
相关读书会：https://pattern.swarma.org/study_group_issue/371

De Domenico：您认为粗粒化方法如何处理在两个不同描述层次之间发生的相互作用？这个框架在捕捉这些相互作用时是否存在局限性？

Rosas：确实。这种方法捕捉到了与“闭合”——可以被视为自给自足——相关的特定类型的涌现。这种方法并不适合研究跨层次的相互作用，例如自上而下的因果作用或类似现象。对于这些，人们必须使用其他方法。顺便说一下，目前还完全不清楚所有这些不同的方法是否能够统一到一个单一的方法中。澄清这一点将是未来重要的工作。

De Domenico：拥有信息闭合性为什么很重要？与传统的统计力学相比，它在关注宏观层面时可以忽略微观细节，这增加了什么？

Rosas：我认为信息闭合性是三种闭合性中最让人兴奋的类型。然而，通过将信息闭合性与因果闭合性和计算闭合性联系起来，人们可以以一种严格的方式将统计力学的概念与干预和计算的思想联系起来。因此，例如，人们不仅可以忽略微观细节，而且可以直接看到通过这样做计算是如何被简化的。顺便说一下，我相信还有很多工作需要更牢固地建立这些桥梁。这篇预印本只是朝那个方向迈出的第一步。

另外我们发现，各个层次可能是不可比的：也就是说，人们可能没有一个完全有序的层次序列，而是一个部分有序的晶格。我相信拥有多种不可比的粗粒化对于生物学和人工智能特别有趣，而充分利用这一点也是未来的工作。

这篇工作基于“ε-machine”的概念，这是 James Crutchfield 引入的一个概念框架，用于理解和分析数据序列中的模式和结构。理解和识别自然现象中复杂性的涌现涉及一个主观但关键的科学方法。它严重依赖于观察者如何构建模型来解释来自他们环境的数据，这些模型受到他们的计算工具的影响（他们可以收集的数据、他们用于存储的内存，以及他们可以投入分析的时间）。观察者可能认为有序、随机或复杂的东西直接与这些计算资源及其组织方式相关。识别模式的有效性在很大程度上取决于观察者使用的计算模型，这反过来可以显著影响观察者识别数据中规律的能力。

Computational Mechanics: Pattern and Prediction, Structure and Simplicity
相关文章：计算力学：量化涌现的又一条路径
相关读书会：https://pattern.swarma.org/study_group_issue/532

例如，想象你正试图基于过去的天气模式来预测天气：一个 ε-machine 将复杂的数据（天气记录）分解为基于之前发生情况的一系列状态。机器中的每个状态代表了数据中的一个特定模式，这些状态之间的转换（比如从雨天模式转换到晴天模式）是由 ε-machine 根据数据创建的规则决定的。目标是使用尽可能简单的规则和状态集合来准确预测数据中接下来会发生什么（这个目标使其与1978年 Jorma Rissanen 提出的最小描述长度原则兼容，同时保持一些差异）。这种方法在研究模式重复或有一定规律的系统时特别有用，因为它可以帮助揭示控制物理、生物或社会复杂系统的潜在过程。

根据 Cosma Shalizi 和 James Crutchfield 的说法，这项雄心勃勃的任务不能简单地通过统计力学来实现。它需要以 ε-machine 作为起点，构建一个互补的分析框架，即计算力学。

话虽如此，我现在准备好我的下一个问题了。

De Domenico：为什么需要考虑（或考虑的主要优势是什么）在每个尺度上使用 ε-machine？

Rosas：使用 ε-machine 提供了数据的双重表示，使得因果或信息闭合的粗粒化格点在 ε-machine 空间中有一个对应的图像，这与计算闭合的自动机格点相对应。这是有用的，因为通常情况下，从“实空间”的格点到“理论空间”的映射并不是一一对应的，所以后者通常更简单。而且，理论空间的格点形状是能最清晰地洞察系统多层次计算结构的形状。

根据 Crutchfield 的工作，我们知道 ε-machine 通过提供一个简化的计算模型来简化复杂数据，这使得理解系统不同部分如何相互作用和发展变得更容易。在这篇新论文中，如果我理解正确的话，作者使用粗粒化进一步将复杂数据简化为模型空间中的可操作结构（由 ε-machine 描述的“理论空间”），并确信这种选择提供了系统多层次组织最简洁（或类似）的描述。[注：我很想在描述长度方面测试一下]。

最后，我对于与网络相关的示例有些困惑，这一点在 Philip Ball 最近的文章中得到了进一步的解释：

其中一个（模型）是随机游走的版本，其中某个主体在某个网络（例如城市街道）中随机漫步。一个城市通常展现出层次结构，社区内部的街道连接密集，而社区之间的街道连接则较为稀疏。研究人员发现漫步者从社区A开始，最终到达社区B——宏观尺度行为——不论漫步者在A或B内部随机穿越哪些街道，这一概率保持不变。（参看《从生命到星系，新数学揭示大尺度秩序如何涌现》）

De Domenico：对于最简单的随机游走动力学，其中转换规则仅是局部的，达到目的地（B）的稳态概率不依赖于网络拓扑和起点（A），因为它仅依赖于目的地的度。然而，对于其他各种随机游走和更现实的动力学来说，情况可能并非如此。您能更好地解释这个问题吗？

Rosas：这是一个非常好的观点。我们的预印本并不是试图对网络上的随机游走说些什么一般性的内容，而是使用一个非常特定的网络来说明计算闭合是如何工作的。所以，虽然人们倾向于将随机游走视为一个局部过程，但对于这个特定案例，下一步的计算可以分解为三个嵌套的任务：

选择下一个社区的大小，
在相同大小的社区中选择某个特定的社区，
在选定的社区中选择节点。

并且我们可以证明，由于网络结构的高度对称性，每个尺度的计算过程与下面的尺度在计算上是接近的。这意味着人们可以在完全忽略下面层次的情况下，完美地模拟这三个层次中的任何一个层次的动力学。

这是一个非常具体的合理的示例。然而，对于更复杂的随机游走来说，情况可能完全不同，所以我将等待这个示例的更精细版本，这对于网络科学家来说非常重要。

小结

涌现描述了复杂的行为和属性是如何从简单（或较简单）单元的相互作用中产生的。这个概念，通常被总结为“整体大于部分之和”。它超越了学科的界限，适用于物理、自然和社会系统。

理解涌现挑战了还原论的观点，并促进发展了我们描述系统内相互作用的概念框架。

本文中介绍的新提出的框架，建立在计算力学的基础上，提供了一种方法来区分某些复杂系统中的宏观行为层次。然而，其适用范围（目前）限于表现出自给自足的闭合系统，并且可能很难将该框架应用于大型系统的实证数据。未来的扩展可能会增强其适用性，另外它是否能够与直接解决跨层次相互作用的现有方法统一，目前还不清楚。

James Crutchfield 关于涌现自组织原理的最新综述
On principles of emergent organization
相关文章：Physics Reports 最新综述：涌现自组织的原理

De Domenico 采访 Hector Zenil

接下来，我们继续从更广泛的角度讨论涌现这个话题。为了这个目标，我向 Hector Zenil 教授提出了一些问题，他是一位复杂性科学家，从算法信息论的角度对涌现有长期的研究。他与合作者一起开发了算法信息动力学（algorithmic information dynamics）。

定义涌现的挑战之一是，一个观察者的先验知识可能导致一个现象被认为是涌现，而对另一个观察者来说，这一现象似乎是可简化的。通过将观察行为形式化为动态系统之间的相互扰动，我们证明了算法信息的出现确实依赖于观察者的知识，同时对其他主观因素具有鲁棒性。——Abrahão 和 Zenil

论文题目：Emergence and algorithmic information dynamics of systems and observers
论文地址：
https://royalsocietypublishing.org/doi/10.1098/rsta.2020.0429

De Domenico：你能详细介绍一下你在《皇家学会哲学汇刊》发表的这篇论文中描述的软件算法方法与 F. Rosas 等人在 Arxiv上提出的 ε-machine 方法的对比吗？更具体地说，这些方法在建模涌现上的关键区别是什么？

Zenil：Rosas 等人的工作和我们的工作之间的主要区别在于，我们的工作强烈植根于因果关系方法的一些最基本的原则。我们的模型没有一个内在的随机方面，这可能是其处理涌现的主要创新，因此它拒绝了所谓强涌现的形式，以及涌现超出本体论还原论的所有神秘主义光环。相反，它将强涌现的出现转稼到观察者的限制上，从而选择了认识论还原论。

译注：本体论还原论侧重于认为在实在的本质上，复杂的事物和现象能够归结为更基本的实体或物质存在形式，强调的是事物本质层面的可还原性；而认识论还原论重点在于知识层面，关注复杂知识能否还原成简单知识去理解，二者侧重点有所不同。例如对于意识现象，本体论还原论可能会主张意识本质上就是大脑神经活动（将意识归结为物理基础存在形式），而认识论还原论则是探讨能否通过对大脑神经细胞、神经递质等基础的相关知识去彻底理解意识这一复杂的认知现象。

在最近的后续论文中（见下文），我们在使用无损统计压缩来近似算法（柯尔莫哥洛夫）复杂性的背景下，进一步研究这个问题。例如，一些编码算法在数据中找到因果模式的能力可能比其他算法更好。这种缺陷是由引入启发式方法的人的特定实例的主观性质引入的。这种主观性之所以可能，是因为最终压缩的不兼容性和不可判定性。当人们被迫采用完全可计算的方法时，例如，通过使用香农熵来近似随机性时，可以检索到“精确值”，但会失去主观性方面，除非像我们在香农熵中那样通过以无法获取联合概率分布的形式人为地将主观性注入模型中。我们的方法是在基础模型中不嵌入概率或随机性，因此在定义涌现方面不发挥任何根本作用。

在某种程度上，我们扼杀了让该领域困惑了几十年的强涌现概念。我认为我们以一种根本的方式做到了这一点，利用了我们认为唯一的因果关系理论，即算法复杂性（Kolmogorov-Chaitin），该理论规定了如何找到和选择可以编写为计算机程序的简短机械答案。换句话说，这些模型是可测试的，可以由机器或人类逐步执行，不需要其他假设，这是科学和科学方法的基础。这是已故 Barry Cooper 教授在可计算性背景下解释涌现的想法的基础。

论文题目：Emergence as a computability-theoretic phenomenon
论文地址：https://www.sciencedirect.com/science/article/abs/pii/S0096300309004159

我们将这种大尺度上的简单性解释为一种斑图形成机制。在这种机制中，大尺度上的斑图的背后，是支配大尺度动力学的简单规则。— Israeli and Goldenfeld

论文题目：Coarse-graining of cellular automata, emergence, and the predictability of complex systems
论文地址：https://journals.aps.org/pre/abstract/10.1103/PhysRevE.73.026203

De Domenico：你引用了 Israeli 和 Goldenfeld 近20年前发表的工作。你能告诉我更多关于早期研究如何与最近关于涌现的研究联系起来的，并加深我们对这些研究的理解吗？当然，共性是粗糙的，但是你认为这项工作的哪些具体方面或发现是关键的，但目前在 Rosas 的工作中体现不足？

Zenil：Israeli 和 Goldenfeld 以及 Rosas 等人的方法之间有许多共同点。Israeli 和 Goldenfeld 认为，多尺度动力学可以看起来彼此独立。他们在元胞自动机（CA）上证明了这一点，就像 Rosas 等人在 CA 上所做的那样，但与 Rosas 等人不同的是，Israeli 和 Goldenfeld 在引用更大规模更新 CA 规则的 Kolmogorov 复杂性时涉及了实际的有限自动机，出现了作为“粗粒度”函数的缩放定律（scaling law）。他们表明，大尺度粗粒度允许在其他细粒度随机系统中的预测能力（如 ECA 规则30），并且独立性是显而易见的。他们论文中因果的成分很少，完全是机械和计算的，而在我看来，Rosas 的论文中的因果和计算内容更少，尽管标题涵盖了计算模型，但不是一种统计方法，是用词不当。

这并不是说 Rosas 等人的贡献毫无价值。如果我没用科学家的偏见视角去看它，我会发现它更有趣，除了我认为与“自然世界中的软件”或“计算方法”相关的层次涌现可能会分散读者的注意力，而且是没有根据的。我们之所以认为这种方法是计算的，就是因为它包含了 ε-machine，而这实际来自名字的误用，也许它是受到实际的自动机使用的启发。我非常尊敬的 ε-machine 的最初作者，称他们的“机器”变量为“因果态”，他们的领域为“计算力学”等等，部分原因是这些变量，根据作者的说法，是“筛选”属性，这些属性对于 Pearl、Spirtes 和其他人在80年代和90年代引入的因果推理统计方法的基础至关重要，但与物理因果关系或计算机程序的因果关系没有任何关系。

De Domenico：你注意到 ε-machine 在很大程度上是随机的，因此仅限于探索相关性而不是因果关系。你能讨论一下使用随机模型研究涌现现象的潜在好处和局限性吗？这些模型如何（或可能）影响复杂系统领域的结果解释？

Zenil：ε-machine 由 James Crutchfield 和 Karl Young 在80年代提出，可能是由有限自动机等实际机器驱动的，但它们根植于80年代由 Judea Pearl 和 Peter Spirtes 等研究人员率先提出的因果方法。ε-machine 是黑盒函数，旨在通过相关函数捕捉因果关系。这就是 Rosas 等人在他们的文章中描述方法时的第一个解释的意思。ε-machine 存在第二个解释，但它不能真正与第一个解释共存，它们是相互排斥的。第二个解释来自原始作者的初衷，不幸的是，迄今为止，Rosas 等人的工作将 ε-machine 描述为某种“自动机”。如果第二种解释成立，论文的贡献会更大，但是论文论证第一种解释是正确的。论文是因为错误的原因而被信任的。

在我看来，基于 ε-machine 的方法研究涌现几乎没有计算或因果内容。这是一种有趣的系统方法，可以在统计相关领域内研究抽象和涌现的程度。对我来说，这篇论文最有趣的部分是这种结合传统信息论和微扰分析的多尺度动力学实验方法。

然而，当一个人认真地把自动机作为对涌现现象的解释时，我们已经使用科学中最传统假设之一（机器解释）的算法信息论原理正式表明，“强涌现”的概念只是一个人工制品。这也与认识论中的随附概念有关。在心智的背景下，这意味着不可能有两个事件在所有物理方面都相同，但在某些“精神”方面有所不同，或者一个物体在不改变某些物理方面的情况下不能改变某些精神方面。换句话说，没有隐藏的无法解释的原因导致了无法从其他潜在原因解释的涌现现象。没有什么是不能被解释的，只有我们作为有限的观察者不能解释。只能有弱涌现，这种涌现类型只出现在旁观者无知的眼睛上。当然，问题有两个方面：（1）我们没有目睹过，所有多重尺度和因果轨迹导致明显的涌现现象，（2）历史上我们在处理因果关系方面一直很糟糕。

科学史及其实践可以被看作是两股相互对立的力量，或者是对非因果 vs 因果解释的发现，从摆脱随机性和偶然性，魔法和神圣的解释到摆脱占星术，再到过去的几十年里摆脱相关性。科学史基本上是我们在每一个给定时间处理因果关系的有限程度的历史，从逻辑的发展到发现自然物理定律。传统上，我们不知道如何处理或衡量因果关系，但在80年代引入了另一种强大的工具，即扰动和干预分析以及反事实的概念。反事实是一种人为的假设，可以再次作为相关性或通过计算机模拟（因此是机械的）来探索。Rosas 等人的工作属于前者（通过相关性来探索），但方向是正确的。

从这个意义上说，Rosas 等人的论文成功地将这些因果工具与传统信息论相结合，以研究涌现的概念。我们团队多年前通过实际的有限自动机（接近通用图灵机和计算机程序）将这些工具与算法信息论相结合，涵盖了过去10年发表的几篇论文，如《Nature Machine Intelligence》、《Physics Reviews E》、《皇家学会汇刊》等，最近由 Springer Nature 出版了一本书，去年由剑桥大学出版社出版了另一本书。我们称之为算法信息动力学的理论和框架（AID）。

Algorithmic Information Dynamics: A Computational Approach to Causality with Applications to Living Systems

为了解释我们是如何将涌现的问题完全推给观察者的，可以参考我们去年发在 Arxiv 上的另外两篇论文。我们发现我们能够不可知地重建消息的寓意，即使这些消息可能包含噪音或部分加扰或解构。这是因为压缩算法的缺陷和不可计算性。如果我们用终极压缩算法完美地度量算法复杂性，消息的所有配置都将携带相同的（算法）信息内容，我们将一开始就无法重建它。因此，大多数观察者的限制揭示了另一个主观发送者的原始意图。因此，在两端，我们都有主观错误系统，它们只能理解对方，因为它们是我们自己的技术问题和数学上的限制。因此，不可计算性导致了意义发现，我们认为这是交流的基础，可以捕捉意义的意义，并可能导致开放的演化。

论文题目：An Optimal, Universal and Agnostic Decoding Method for Message Reconstruction, Bio and Technosignature Detection
论文地址：https://arxiv.org/pdf/2303.16045
论文题目：Decoding Geometric Properties in Non-Random Data from First Information-Theoretic Principles
论文地址：https://arxiv.org/pdf/2405.07803

De Domenico：您认为还有哪些其他关键论文或研究人员应该包含在关于基于算法和软件的涌现的讨论中？

Zenil：Rosas 等人的论文在引用以前关于经典信息论和涌现的工作方面做得很好，但是当谈到结合算法、计算和软件方法来处理因果关系和涌现时，我已经在上面提到了一些，包括 Cooper 的、Israeli 的和 Goldenfeld 的以及我们自己的工作，我认为这些工作帮助推动了这个领域的发展。

我经常感到不幸的是，科学写作已经变成了某种科学小报新闻，试图为一篇科学作品找到最佳的商业角度来吸引人们的注意力。一些科学媒体和作家在决定公众应该消费什么以及如何消费科学方面变得过于强大，科学媒体只是复制文章，放大可能发出错误信息的信号，现在甚至连科学影响者也制作视频复制已经大肆宣传的原始来源。这不应该是科学新闻对我们今天生活的后真相的、分裂的社会所提供的价值。我们应当追求更客观的平衡和准确性。关于一个话题的新闻工作应该是提供信息、背景和真正对立的观点。

这种通过科学媒体的镜头对现实的变形也发生在其他领域上，如“组装理论”（assembly theory）和“整合信息论”（integrated information theory）。整合信息论有不错的价值，但他们受到了一堆炒作的阻碍，这些炒作是媒体中关于意识问题的一个被证明的解释。这个现象已经超过十年了，直到一个转折点，迫使一群学者有点过度地反对整合信息论。

后记

与此同时，我认为 Hector 也强调了科学新闻领域的一个关键问题。科学新闻不仅对复杂性科学，而且对整个科学的进步发挥着重要作用。最近，出现了一种明显的趋势，即用吸引眼球的标题和简化的叙述优先吸引读者眼球而不是在意内容的全面。这种转变通常是由少数作家推动的，他们决定什么是有新闻价值的，以及如何呈现，这可能会阻碍科学进步。

这一趋势可以部分归因于科学新闻日益商业化，编辑和作者面临的经济压力可能会损害科学发现的深度和迭代性质。科学进步的本质——以细致（有时永无止境）的讨论、假设检验和验证为特征——与商业利益驱动的快速步伐和有时肤浅的报道相矛盾，商业利益可能更符合资助者或利益相关者，而不是科学界首先关注的问题。

此外，争夺声望、资金和关注的竞争压力可能不利于科学家与同行接触的宝贵时间，并可能影响已发表研究的质量。2023年论文撤回的大幅增加进一步证明了这一担忧，凸显了反思的必要性。

本文翻译自 Manlio De Domenico 的博客文章。
原文链接：
https://manlius.substack.com/p/a-computational-approach-to-emergence
https://manlius.substack.com/p/a-computational-approach-to-emergence-536

阅读最新前沿科技研究报告，欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或点击本文左下角“阅读原文”进入。

截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0（167页）

3. 战略与国际研究中心（CSIS）人类地月空间探索的总体状况研究报告（2024）

4. 人工智能与物理学相遇的综述（86页）

5. 麦肯锡：全球难题，应对能源转型的现实问题（196页）

6. 欧米伽理论，智能科学视野下的万物理论新探索（50页报告）

7. 《美国反无人机系统未来趋势报告（2024-2029 年）》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015（94页）

11. CB Insights：未来变革者：2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页，美国防部首席数字和人工智能办公室（CDAO）

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP：2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察：引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起：整合人工智能、区块链技术与量子计算(研究报告，书）

19. OpenAI o1 评估：AGI 的机遇和挑战（280页）

20. 世界知识产权组织：2024 年全球创新指数（326页）

21. 美国白宫：国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索，243页

23. 中国信通院：量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能，144页

26. 联合国：《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织：2024团结在科学中，守卫地球系统的未来

28. 世界经济论坛《量子技术助力社会发展：实现可持续发展目标》研究报告

29. 人工智能科学家：迈向全自动开放式科学发现

30. 欧盟：石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会：美国的数字身份之路研究报告

32. 麦肯锡：2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议：2024世界投资报告

34. 兰德：评估人工智能对国家安全和公共安全的影响

35. 兰德：2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织：2015-2022 年生物多样性与发展融资

37. ITIF：中国半导体创新能力研究报告

38. 英国皇家学会：数学未来计划，数学和数据教育的新方法研究报告

39. 欧盟：10年人类大脑计划创新评估报告

40. GLG格理集团：2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国：2024为人类治理人工智能最终报告

43. 达信Marsh：2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询：2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价：准确性、无害性和公平性，223页pdf

46. 麦肯锡：2024世界能源产业展望

47. 世界经济论坛《太空：全球经济增长的 1.8 万亿美元机遇》

48. 世界经济论坛：世界“技术先锋”名单100家公司名单

49. 世界经济论坛：2024绘制地球观测的未来：气候情报技术创新

50. 核聚变技术作为清洁能源供应替代来源的全球发展和准备情况

51. 大模型生成的idea新颖性与人类对比研究报告（94页）

52. IQM ：2024 年量子状况报告

53. 2024十大新兴技术研究报告

54. 2024地球观测 (EO) 洞察带来的全球价值（58页）

55. 2023-2024世界基础设施监测报告

56. 世界银行：2024世界发展报告，中等收入陷阱

57. 2024国际前沿人工智能安全科学报告132页

58. 斯坦福大学2024人工智能指数报告

59. 美国总统科学技术顾问委员会：《利用人工智能应对全球挑战》63页报告

60. 柳叶刀行星健康：2024地球系统安全与健康评估报告

61. 中国未来50年产业发展趋势白皮书III

62. OpenAI o1系列产品原理与安全最新研究报告（80页）

63. 国家互联网信息办公室：国家信息化发展报告2023年110页

64. 埃森哲：2024年风险研究报告-重大颠覆需要持续重塑英文版39页

65. 36氪研究院：2024年中国城市低空经济发展指数报告41页

66. 美国信息技术与创新基金会：《中国在量子领域的创新能力如何》研究报告

67. 理解深度学习500页报告

68. 鼎帷咨询：2024全球人工智能发展研究报告44页

69. 【伯克利博士论文】大型语言模型迈向能够学习和发现一切的机器

70. 《量子技术：前景、危险和可能性》45页报告

71. 英国皇家学会报告：人工智能在科学、技术、工程和数学领域的应用

72. 未来今日研究所：2024世界技趋势报告（980页）

73. 面向大规模脉冲神经网络：全面综述与未来方向

74. 大模型+知识库市场全景报告

75. 《太空力量的理论基础：从经济学到不对称战争》2024最新94页报告

76. CBInsights：2024年第二季度全球企业风险投资状况报告英文版124页

77. 英国科学院：数据管理和使用：21 世纪的治理（2024），99页

78. 兰德智库：展望2045 一项前瞻性研究探讨未来 20 年全球趋势的影响

79. 世界知识产权组织：2024年世界知识产权报告：让创新政策促进发展

80. 全球灾难风险研究所：评估大型语言模型接管灾难的风险

81. 牛津马丁学院：人工智能风险国际科学评估的未来

82. 联合国贸易和发展署：2024世界投资报告

83. 兰德公司：人工智能军事应用的新风险和机遇

84. 英国皇家学会：AI时代的科学发展趋势研究报告

85. 百页风电行业研究方法论：从中国到世界从陆地到海洋-240902，98页

86. 中国信通院发布《大模型落地路线图研究报告（2024年）》

87. 星河智源：2024年无人驾驶技术全景报告35页

88. 星河智源：2024年光刻机技术全景报告37页

89. 人形机器人行业研究方法论：特斯拉领衔人形机器人的从1到N

90. 兰德：展望2045一项关于未来20年全球趋势影响的前瞻性研究报告英文版45页

91. 《军事创新与气候挑战》2024最新152页报告

92. 麦肯锡：2024困难点：驾驭能源转型的物理现实（196页）

93. 《麻省理工科技评论》万字长文：什么是人工智能？

94. 软件与服务行业：从特斯拉智能驾驶看人形机器人发展路径

95. 中国信通院：中国数字经济发展研究报告2024年82页

96. CB Insights：2024年第二季度全球风险投资状况报告 244页

97. 脑启发的人工智能：全面综述

98. 二十年关键技术跟踪报告

99. 中国首部城市大脑系列建设标准（8项）汇编

100. 麦肯锡2024技术趋势展望报告100页

人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构