从微观到宏观，基于格兰杰因果量化涌现

学术 2024-12-09 00:00 加拿大

导语

基于格兰杰因果量化涌现 (Measuring emergence via Granger causality)[1]是一种运用格兰杰因果(Granger causality)来量化系统涌现特性的分析方法。该方法通过评估宏观变量相对于微观变量集合的格兰杰自主性(G-autonomy)与格兰杰因果关系，判断宏观层次是否展现出较微观层次更强的因果特性。特别是在非线性系统中，此方法能够揭示不同层次间的因果依赖性，为复杂生物、社会及认知系统的涌现现象提供了一种定量分析工具。

近年来，张江老师带领研究组开始聚焦基于新兴AI技术进行数据驱动的自动建模研究，并立志破解复杂系统的涌现之谜。我们希望创建一个叫做“复杂AI次方”的开放实验室，实现思想共享、资源共享、跨学科交叉，共同为复杂系统自动建模而奋进。欢迎对复杂系统自动建模领域有热情，且认可这个领域发展前景的朋友一起来合作，促进这一领域的快速发展。

关键词：复杂系统，涌现，格兰杰因果，G-autonomy，非线性

许世鹏 | 作者

张江、王志鹏 | 审校

1. 简介

2. 涌现的类型

2.1 名义涌现

2.2 强涌现

2.3 弱涌现

3. 格兰杰涌现（G-涌现）方法

3.1 格兰杰因果测量

3.2 格兰杰自主性测量

3.3 格兰杰涌现测量

3.4 非线性格兰杰涌现测量

4. 格兰杰涌现方法的应用示例

4.1 鸟群模拟

4.2 鸟群涌现测量

4.3 鸟群向下因果测量

5. 格兰杰涌现方法的局限性

5.1 历时涌现问题

5.2 相变问题

5.3 必要的宏观变量

6. 与其他测量方法的关系

6.1 宏观预测

6.2 情境涌现

6.3 多尺度系统熵

7. 在意识与强涌现领域的潜在应用

8. 总结

1. 简介

涌现 (emergence) 在人工生命和复杂性科学中至关重要。然而目前关于涌现的定量、直观且易于应用的测量方法却极为匮乏。本文提出了一种名为“G-涌现” (G-emergence) 的新测量方法，它将涌现过程“既受到底层因果因素的影响，同时又具备自身独立性”的这一概念进行了具体化和应用。G-涌现基于“格兰杰因果关系”的非线性时间序列分析，能够同时衡量涌现现象和向下因果 (downward causation)。我们将通过一个经典的涌现实例——基于智能体 (Agent) 的鸟群模拟来展示这一方法的应用，并探讨了它对科学中最具挑战性的涌现问题之一的意识问题可能产生的深远影响。

近年来，随着人工生命和复杂性科学的发展，人们对涌现现象重新产生了兴趣。虽然涌现的概念有着悠久的哲学历史[2][3]，其核心思想其实非常简单：一种涌现的属性通常是“整体大于部分的总和”。在各类复杂系统中，涌现属性非常普遍，比如在生物系统、认知系统、社会系统和技术系统中。总体来说，人工生命和复杂性科学主要是解释看似与涌现相关的现象，而这些领域中的模型通常被描述为具有涌现性质[4]。因此，令人惊讶且值得注意的是，目前缺乏定量且易于应用的涌现测量方法。而这很可惜，因为科学上对现象的有效描述很大程度上依赖于是否能对其进行测量[5]。

在本文中，我们将首先区分几种涌现的概念，并借此简要说明其中的一些关键挑战。接着，我们将介绍一种名为“G-涌现” (G-emergence) 的新测量方法，这种方法具体化了一个直观的想法，即涌现过程既独立于其底层因果因素，同时又依赖于这些因素。因此，G-涌现被定义为宏观变量自主性 (autonomous) 与微观变量对宏观变量因果性均值的乘积。G-涌现简单易用，我们会通过一个经典的涌现现象例子——鸟群飞行的模拟来展示这一方法的应用 (下图是一群即将栖息的椋鸟) 。最后，我们将讨论相关的测量方法，如何化解“向下因果” (downward causation) 这一形而上学上的难题，以及它如何为科学中最难解决的问题之一的神经机制与现象体验之间的关系带来新的启示。

值得注意的是，基于格兰杰因果量化涌现的方法可以视为一种早期的因果涌现理论，早在Erik Hoel于2013年提出因果涌现理论[6]之前便已发展。Erik Hoel的因果涌现理论从信息论角度定义了“有效信息” (Effective Information，简称EI)，有效信息可以用来衡量一个马尔科夫动力学的因果效应的强度，进而揭示宏观层级因果作用可能超越微观层级的现象。而G-涌现则通过评估宏观变量相对于微观变量集合的格兰杰自主性 (G-autonomy) 和格兰杰因果 (G-causality)，定量分析宏观层级是否展现出涌现特性。总之，格兰杰因果量化涌现的方法为复杂系统涌现现象提供了定量工具，是因果涌现领域的一次重要尝试。

2. 涌现的类型

从直观上看，涌现可以指两种情况：一种是宏观层面的属性，它“超越了微观部分的总和”（称为“属性涌现”或“共时涌现”，property/synchronic emergence）；另一种是随着时间推移，出现了某种全新的、有质的区别的现象（称为“历时涌现”，temporal/diachronic emergence）。一个属性涌现的典型例子是当鸟群在天空中飞行时，鸟群似乎拥有独立的形状和轨迹，远远超越了每只鸟的个体行为。历时涌现的典型例子则可以从胚胎发育过程中，新形态特征逐渐形成的过程看出。本文主要探讨如何衡量属性涌现，但也指出了衡量历时涌现的潜在机会。根据 Bedau[7][4]的分类，属性涌现和历时涌现都可以进一步划分为三类：强涌现（strong emergence）、弱涌现（weak emergence）和名义涌现（nominal emergence）。

2.1 名义涌现

最不具争议性的是名义涌现，它指的是一种宏观层面的属性，虽然它存在于宏观对象或过程之中，但在微观层面是没有的。例如，一个圆是由一组点构成的，但圆这个属性是这些点在宏观层面的涌现，因为它不能简单地从每个点中得到。由于名义涌现的推导非常简单，本文不再详细讨论。

2.2 强涌现

最具挑战性和争议性的是强涌现，它包括两个密切相关的观点。首先，宏观层面的属性原则上无法从微观层面的观察中辨别出来。其次，宏观层面的属性具有不可还原的因果力量。第一个观点完全否定了机械论解释的可能性，似乎意味着如果没有新的自然基本原理，科学的进展将停止[8]。第二个观点引发了“向下因果作用”（downward causation）这一复杂概念。向下因果作用的问题在于，它违背了“宏观的存在方式是由微观决定的”这一合理理论，这一理论被称为“因果基础论”（causal fundamentalism）[9]或“随附性”（supervenience）[3]。此外，向下因果作用还带来另一个挑战，即如何解决微观层面与宏观层面之间的因果冲突[4]。即便如此，强涌现最大的挑战可能在于其在科学上的不重要性[4]。目前科学文献中唯一反复出现的强涌现例子是意识状态（如感质，qualia）从神经生物过程中的涌现[10][8]，这更多地说明我们对意识的理解不足，而非对涌现深层原理的掌握有限。后文将进一步探讨这一可能性。

2.3 弱涌现

弱涌现的概念介于强涌现和名义涌现之间[7][4]。在弱涌现中，宏观层面的属性来源于微观层面组成部分的相互作用，但这种相互作用非常复杂，以至于宏观属性无法简单地通过微观解释来得出。与强涌现不同，弱涌现的宏观属性原则上是可以从微观层面辨别出来的。与名义涌现不同，微观到宏观的推理路径并不简单。据 Bedau 所述，弱涌现的宏观属性在本体上依赖于并可还原为微观因果因素，但由于微观到宏观的推导路径复杂，导致在认识上无法轻易还原。

那么，宏观属性在认识上不可还原是什么意思呢？Bedau 的回答是，弱涌现的（在认识上不可还原的）属性只有通过模拟才能推导出来。这是一种非此即彼的分类：要么宏观属性可以通过某种解释捷径推导出来，此时弱涌现不适用；要么无法推导，此时必须明确模拟微观因果因素来得出宏观属性。

本文提出了一个连续的弱涌现度量版本，认为宏观属性在多大程度上无法从微观层面观察中辨别，决定了其弱涌现的程度。该研究之所以有价值，首先是因为对于许多系统来说，如何按照弱涌现的定义，证明“可能通过模拟推导”可能并不现实；其次，该研究给出了涌现一个定量性的刻画，从测量的角度来看，连续值比二元分类更有用。

3. 格兰杰涌现（G-涌现）方法

为了得出一种连续的弱涌现的测量方法，我们从一个基本概念开始：一个弱涌现的宏观属性同时具备 (i) 自主性和 (ii) 对其底层因果因素的依赖性[7]。为了将这一概念转化为统计学上的操作方法，我们提出可以通过如下方式来衡量一个宏观变量

M

相对于一组微观变量

m

（其中

(m = m 1, m 2, . . ., m N)

）的弱涌现程度：条件1）：

M

的过去观测值能够比仅基于

m

的过去观测值更准确地预测

M

的未来观测值；条件2）：

m

的过去观测值能够比仅基于

M

的过去观测值更准确地预测

M

的未来观测值（见下图）。

第一个条件提供了一个客观的度量标准，来衡量从微观到宏观的推导路径是否具有非平凡性；第二个条件则检验了从微观到宏观的因果依赖性。这个定义依赖于宏观和微观描述层次的选择，同时也依赖于预测方法的选择。正如后文所述，格兰杰[11]最早提出的因果关系的统计定义，为这种预测提供了适当的框架，因此本文将这种测量方法称为G-涌现（G-emergence）。

3.1 格兰杰因果测量

1969年，Granger提出了“格兰杰因果”（Granger causality，简称G-causality）的概念，这是对Wiener直觉的形式化表达。Wiener的直觉是，如果知道变量

Y

有助于预测变量

X

的未来，那么我们就可以说

Y

“导致”了

X

[11][12]。根据格兰杰因果关系，如果在一个包含

X

和

Y

的线性回归模型中，相比于仅使用

X

的过去观测值的模型，加入的

Y

过去观测值能够减少

X

的预测误差，那么可以被认为

Y

是导致了

X

。

自提出以来，格兰杰因果关系已广泛应用于经济学及其他领域，如神经科学和气候学[13] [14]。为说明格兰杰因果关系，假设有两个时间序列

X 1 (t)

和

X 2 (t)

时间长度均为

t

，它们的时间动态可以用一个双变量自回归模型来描述。

其中，

p

是模型中包含的最大滞后观测值的数量（即模型的阶数，

p < T

），表示过去

p

个时间点的观测值将被纳入模型。

j

是一个索引变量，表示每个滞后步长（从

1

到

p

），在每个时间点上依次考虑的过去观测值。

A 11, j

、

A 12, j

、

A 21, j

和

A 22, j

是自回归模型中的系数，表示每个滞后步长

j

对相应变量的影响强度，这些系数是模型学习得到的参数，用于描述不同滞后项的影响。

X 1 (t - j)

和

X 2 (t - j)

分别表示时间

t - j

时刻的变量

X 1

和

X 2

的值，用于反映过去

j

个时间步长对当前值的影响。

ξ 1 (t)

和

ξ 2 (t)

是每个时间序列的残差（或预测误差），表示模型未能解释的部分。如果在第一个（或第二个）方程中引入

X 2

（或

X 1

）项后，

ξ 1

（或

ξ 2

）的方差减小，那么可以说

X 2

（或

X 1

）对

X 1

（或

X 2

）具有格兰杰因果性。

假设

X 1

和

X 2

是协方差平稳的（即它们的均值和方差不随时间变化），那么这种相互作用的大小可以通过比较受限模型（

R

）和非受限模型（

U

）预测误差方差的对数比率来衡量：

其中，

g c

2

\to 1

表示从变量

X 2

到变量

X 1

的格兰杰因果性测量值。

ξ 1 R (12)

是从省略了是从省略了第一个方程中的

A 12, j

（对所有

j

）系数的模型中得到的预测误差；

ξ 1 U

是从包含

X 2

对

X 1

影响的完整模型中得到的预测误差。通过计算的对数，

g c

2

\to 1

可以量化

X 2

对

X 1

的预测贡献。如果

g c

2

\to 1

的值为正，说明包含

X 2

能显著减少

X 1

的预测误差，表明

X 2

对

X 1

有格兰杰因果性。重要的是，格兰杰因果关系很容易推广到多变量的情况，在这种情况下，检验的是在多个变量

X 2 . . . X n

的上下文中的格兰杰因果关系（对所有

X i \neq X j

）。在这种情况下，如果当所有其他变量

X 3 . . . X n

的活动也包含在回归模型中时，知道

X 2

会减少

X 1

预测误差的方差，那么

X 2

对

X 1

具有格兰杰因果性。有关格兰杰因果关系的教程介绍，请参阅 Seth[12]。

3.2 格兰杰自主性测量

格兰杰因果关系的一个简单扩展，是可以度量出相对于其他变量集来说，一个变量对自身的“统计自主性”的程度[15]。在这种情况下，与其探讨通过包含

X 2

的过去观测值是否能减少

X 1

的预测误差，我们更关注通过包含

X 1

自身的过去数据（在给定一组外部变量的条件下）是否能减少

X 1

自身的预测误差。也就是说，变量的格兰杰自主性体现在，在基于一组外部变量的过去状态的预测之外，其自身的过去状态是否有助于预测其未来状态。与格兰杰因果关系类似，相对于的格兰杰自主性定义为：

其中，

g a

X 1 | X 2

表示变量

X 1

相对于变量

X 2

的格兰杰自主性。它通过计算两种情况下的预测误差方差的对数比率来衡量，即在不包含

X 1

过去信息的受限模型（仅使用

X 2

的信息）和包含

X 1

过去信息的完整模型之间的差异。如果

g a

X 1 | X 2

值为正，表示

X 1

的过去状态对预测其未来状态有显著贡献，体现了

X 1

的统计自主性。

ξ

1 R (11)

是从省略了

A

11, j

（对所有

j

）系数的受限模型中得到的预测误差，而

ξ

1 U

是从完整模型中得到的预测误差。

格兰杰自主性放大了“自我决定”这一自主性概念，与其他更为抽象的概念（如“组织封闭性”[16]）形成对比。它与这样一种观点相一致，即（在行为上）自主的系统不应完全由其环境决定，且随机系统不应具有高度自主性 [17]。简而言之，变量的格兰杰自主性在于它依赖于自身的历史，而这些依赖关系不能通过外部因素来解释。之前我们已表明，格兰杰自主性在简单模型系统中表现符合预期，并且可以作为进化适应的结果而增加[15]。

3.3 格兰杰涌现测量

在定义了格兰杰因果和格兰杰自主性之后，扩展到格兰杰涌现是直接的。当且仅当

M

对一组微观变量

m

是格兰杰自主的，且

M

由

m

引起时，宏观变量

M

被认为是从一组微观变量

m

中涌现的。衡量

M

从

m

中的格兰杰涌现性可以被定义为

M

自主性与

m

对于

M

因果性（均值）的乘积，即 G-涌现的定义式：

其中，

g e

M | m

表示宏观变量

M

在微观变量

m

集合中的格兰杰涌现性。该度量捕捉了弱涌现性的三个基本直觉：它是名义涌现性的一个子集，涉及对底层过程的依赖，并且它涉及从底层过程中的自主性。

g a

M | m

表示变量

M

相对于变量

m

的格兰杰自主性。公式中的

N

表示微观变量的数量，

g c

m i \to M

表示单个微观变量

m i

对宏观变量

M

的格兰杰因果性。重要的是，

g e

M | m

将为零，如果

M

独立于

m

或者

M

完全被

m

预测。

在什么情况下格兰杰涌现性可能会很高？如果有“隐藏”或“潜在”的影响，即回归中未表现出来的相关微观因果因素，宏观变量可能从一组微观变量中涌现。然而，即使所有微观因果因素都存在，格兰杰涌现性仍可能因为依赖于所用的预测算法而产生。可以认为，事实上，为了在实践中有用，格兰杰涌现性是必要的，因为在某些情况下，宏观变量对预测算法来说比微观变量的集合更具有认识透明性。这也与Bedau的“弱涌现”理论一致，即有些复杂现象只能通过模拟才能理解或预测。而在这里，这种“必须通过模拟才能得出”的特性被改成了“能否通过格兰杰因果关系预测”。也就是说，这里更关注是否能够通过一种特定的方法（格兰杰因果分析）来预测，而不是单纯依赖复杂的模拟过程。

3.4 非线性格兰杰涌现测量

对使用线性建模测量格兰杰涌现的一个明显批评是，一个宏观变量可能由于其是微观层面组件的非线性函数而表现为格兰杰涌现。因此，一个更完善的涌现测量方法应该超越线性方法的局限性。幸运的是，扩展格兰杰因果关系（从而扩展格兰杰自主性和格兰杰涌现）到非线性情况是容易的，例如通过泰勒展开：

其中，

p

是最大滞后阶数，表示时间序列在过去

p

个时间点的延迟值；

q

是泰勒展开中包含的多项式项数，用于捕捉非线性依赖性；

A

i e, j, k

表示每个变量

i

对其他变量

e

在不同阶数

k

和延迟

j

上的影响系数；表示变量

X i

在时间

t - j

时刻的值的

k

次幂项，用于捕捉非线性效应；

ξ i (t)

是每个方程中的残差项，表示模型未解释的部分。通过这种多项式项的扩展，可以捕捉更复杂的变量间非线性关系，并且这种方法适用于多变量（

n > 2

）的情境。

在这个例子中格兰杰涌现性（考虑了多个微观变量

X 2

和

X 3

对宏观变量

X 1

的影响）的计算方法为：

其中，

g e

X 1 | X 2, X 3

表示变量

X 1

相对于变量

X 2

和

X 3

的格兰杰涌现性。根据之前的约定，

ξ 1 R (11)

是从省略了

A a b

系数的模型中得出的（如公式 (3) 所示）。如果相应的格兰杰自主性和格兰杰因果关系测量值本身在统计上显著，则线性或非线性格兰杰涌现性值可以被视为具有统计显著性。这可以通过对零假设进行F检验来评估，即

A 11

（格兰杰自主性）和

A 12 \dots A n

（格兰杰因果关系）的系数为零。

值得注意的是，格兰杰涌现性的概念并不依赖于使用特定的非线性回归方法。还有其他更为复杂的方法比泰勒展开更不易受噪声观测的影响，并且涉及更少的参数。例如，Ancona等人[18]已经表明，径向基函数可以作为有效的回归核来测量非线性格兰杰因果关系。然而，出于当前的目的，泰勒方法是更可取的，因为（i）它简单易于描述和实施;（ii）统计显著性可以很容易地评估;（iii）它提供了格兰杰涌现性的明确公式（如公式 (4)）。

最后，值得注意的是格兰杰涌现性的值将取决于包含在

m

中的微观变量集。因此，在一个异质系统中，我们可以通过识别一个格兰杰涌现集，即能够最大化

g e

M | m

的微观变量集来计算出最优化的格兰杰涌现值。

4. 格兰杰涌现方法的应用示例

4.1 鸟群模拟

现在，我们将展示在一个简单的计算模型中，格兰杰涌现性如何表现出适当的行为。如前所述，一个经典的属性涌现示例是鸟群中的群集行为。在人工生命的开创性工作中，Reynolds[19]表明，通过为模拟的鸟（boids）组合三个简单规则，可以模拟出视觉上引人注目的鸟群集行为：

• 聚集：每只鸟倾向于飞向感知到的鸟群的质心（ $C M$ ）。

• 规避：每只鸟倾向于避免与其他附近的boid碰撞。

• 协同：每只鸟倾向于将自己的速度与其他附近鸟的速度对齐。

这里使用一个简单的boid模拟来测试视觉上引人注目的群集行为是否与鸟群质心（宏观变量）相对于各个boid轨迹（微观变量）的高格兰杰涌现性相关。

模拟了个boid，在边长为200的环形方形环境中进行（所有维度和距离以任意单位表示；速度以每时间步为单位）。boid的初始位置和速度随机选取自范围 [0,200]（位置），[0, 2π]（航向），和 [3,9]（速度）。在每个时间步中，每个boid的航向和速度同步更新，更新规则如下：

其中，

α i

表示第

i

只鸟的方向角。

a 1 ， a 2 ， a 3

是用于调整不同方向影响权重的参数（权重系数）。

θ 1

是朝向感知到的质心的方向（不包括boid

i

的质心），

θ 2

是朝向最近boid的方向，

θ 3

是朝向所有其他boid的平均航向（在20单位范围内），

s i

表示第

i

个boid的速度，

a 4

是用于调整速度变化的比例系数，决定了

对速度更新的影响程度，

是 boid

i

的速度与20单位范围内其他boid的平均速度的差异，

r ₁

和

r ₂

是范围 [-0.01, 0.01] 内的随机数。参数向量

α

（所有

α

∈ [0,1]）决定了每个因素的相对贡献。环形世界中的距离按照标准欧氏距离方式计算，既可以跨越边界也可以不跨越边界。质心位置通过迭代计算以最小化每个boid与其他boid的环形距离（即不是与质心的平均距离，从而避免边界伪影）。质心获取方法如下：

其中，

r i

是第

i

只鸟的位置向量。

r

CM

是质心的位置向量。

d (r i, r

CM

)

是在环形空间中鸟的位置与质心之间的最小距离。

这里测试了三种不同的模拟条件。(1)随机条件(

R

)。该条件产生了接近随机的boid行为

α R = [0.01, 0.01, 0.01, 0.01, 0.01, 0.01]

。(2)低群集条件(

L

)。该条件通过增强对速度匹配的强依赖性引发了较差的群集行为；在这种条件下的 boid 趋向于半刚性的队形移动

α L = [0.1, 0.1, 0.6, 0.6]

。(3)高群集条件(

H

)。该条件引发了引人注目的群集行为；参数集

α H = [0.1, 0.3, 0.3, 0.3]

是手动选择的。每种条件下 boid 和质心轨迹的示例显示在下图中，左上图为不同条件下线性和非线性格兰杰涌现性的均值和标准差（星号表示统计显著性），其它图为在条件

H

（高格兰杰涌现性）、

L

（低格兰杰涌现性）和

R

（随机）下，boid（灰色）和质心

C M

（红色）的示例轨迹（500时间步片段）。尽管静态图像无法完全捕捉群集行为的动态特性，但很明显，条件

H

下的 boid 轨迹比条件

L

和

R

下的更像群集行为。

4.2 鸟群涌现测量

对于每个条件，boid模拟运行了25次，每次运行持续5000个时间步；在每次运行中，记录了每个boid的x和y坐标以及全局质心。在计算格兰杰涌现性之前，进行了几个预处理步骤。为了降低数据集的维度，并增强对边界效应的鲁棒性，将每对x和y坐标转换为反映环境中心距离的单个变量。前500个数据点被移除，以消除初始瞬态效应，结果得到的时间序列被转换为零均值的等效时间序列。最后，为了确保协方差平稳性[20]，对每个时间序列进行了一级差分处理。预处理完成后，在每个条件下的每次运行中，使用最小二乘回归分别计算了质心 (

C M

) 的线性和非线性格兰杰涌现性。我们选择了模型阶数

p = 5

和（用于非线性分析的）多项式阶数

q = 3

。模型阶数是基于所有75次运行的平均Akaike信息准则[15]选定的。

上图显示了每个条件下质心的平均线性和非线性格兰杰涌现性。结果证实了高格兰杰涌现性与引人注目的群集行为相关，线性和非线性度量均显示，条件

H

下的格兰杰涌现性显著高于条件

L

和

R

。条件

H

和

L

下的所有格兰杰涌现性值都是显著的（格兰杰自主性和格兰杰因果关系的

P

值均小于

10

- 5

，双尾

t

检验）；而条件

R

下的结果则不显著。

为了测试boid模型中不同参数组合下格兰杰涌现性的行为，我们在参数空间

α (1, 2, 3) \in [0.0, 0.1, \dots, 1.0]

中计算了每个参数向量的线性和非线性格兰杰涌现性。由于参数

α 3

和

α 4

都影响同一规则（速度匹配），它们被配对在一起进行评估，并为每个向量进行了三次评估，总共需要

11 \times 11 \times 11 \times 3 = 3993

次评估。下图显示了穿过三维参数空间的三个正交剖面的格兰杰涌现性，在每个剖面中，向量

α H

（条件

H

）由绿色线的交点标记，灰度显示全局

C M

的平均线性和非线性格兰杰涌现性，每个值是5000时间步的三次评估的平均值，红点表示导致时间序列可靠地非平稳的参数组合。

这些剖面中有几个值得注意的方面。首先，线性和非线性格兰杰涌现性高度相关，这表明即使是线性度量在某些复杂系统中也能提供对涌现属性的洞见。其次，在参数空间的大多数区域中，格兰杰涌现性平滑变化，表明这是一种稳健的度量方法。然而，在某些区域中，出现了明显的跃迁，例如在一些

α 1 = 0

的向量与其相邻向量之间的跃迁。格兰杰涌现性对这些跃迁的敏感性表明，它可以有效识别复杂模型中存在非平凡弱涌现的参数区域。

4.3 鸟群向下因果测量

一个关于涌现的普遍直觉是它涉及从宏观层面到微观层面的“向下”因果关系。对于强涌现的支持者来说，向下因果关系实际上是涌现本质的一个关键方面[3]。然而，向下因果关系的物理解释会引发复杂的形而上学问题，例如如何解决微观和宏观因果之间的竞争[4]。格兰杰涌现性由于是统计定义的，提供了一种形而上学的替代方案。这里的向下因果计算方法是将上文中格兰杰因果计算公式中的宏观变量

M

对微观变量

m

位置进行调换得出。

上图展示了从全局质心到boid个体轨迹的向下（格兰杰）因果关系，涵盖了线性和非线性的格兰杰因果关系测量。在每个条件下，对所有boid和所有25次运行取平均值。结果显示条件

H

下的向下因果关系显著高于条件

L

或

R

。箱线图显示了从全局

C M

到单个boid的线性和非线性格兰杰因果关系，分别计算了每个条件下所有25次运行中的每个boid（即每个箱线图包含250个值）。非显著的因果关系被设为零（名义阈值为0.01，经过Bonferroni校正为

10

- 5

）。所得分布为非正态分布，并使用Wilcoxon秩和检验比较各条件间的差异。对于线性和非线性分析，所有条件间的中位数成对比较差异均显著（

p < 10

- 3

）。每个箱线图显示下四分位数、中位数和上四分位数值；虚线显示剩余数据的范围，‘

+

’号表示异常值。实验结果与“涌现和向下因果关系之间存在关联”的假设相一致——向下因果关系的两种测量在条件

H

下明显高于条件

R

或

L

。尽管有这一结果，原则上弱涌现似乎可能在没有向下因果关系的情况下发生（当然，强涌现按定义需要向下因果关系）。拥有可分别应用的弱涌现和向下因果关系的测量方法，使得探索涌现和向下因果关系不同时发生的条件（如果存在）成为可能，从而潜在地细化和深化了涌现的概念。

5. 格兰杰涌现方法的局限性

在本文中，我们介绍了一种通过物理测量来检测系统中弱涌现程度的方法。由于该方法基于因果关系的统计解释，它规避了微观和宏观因果关系之间的竞争等概念上的难题，同时为微观到宏观推理路径的复杂性提供了客观且分级的评估方法。作者在个人网站上提供了用于计算G-涌现的 MATLAB 代码，适用于任意时间序列数据。

5.1 历时涌现问题

历时涌现（Diachronic emergence）指的是随着时间推移，系统中出现新的属性，比如进化或发育过程中的变化。历时涌现的过程本质上是统计上不稳定的，因此不能直接用 G-涌现来测量。然而，我们可以假设历时涌现的过程由不同的、统计上稳定的时间段构成，而这些时间段有着不同的 G-涌现特性。通过这种方式，G-涌现可以间接推断出历时涌现的存在。

5.2 相变问题

近年来，物理学家开始对boid 模型中的自驱动粒子集体行为产生了兴趣[21][22]。在这些系统中，可以观察到从“气态”相（每个粒子独立运动）、“液态”相（粒子集体移动但相对彼此仍有扩散）、到“固态”相（粒子集体移动并彼此保持固定）等相变（Phase transitions）。这些相变可能分别对应于本文模型中的

R

、

H

和

L

条件，穿过三维参数空间的三个正交剖面的格兰杰涌现性图中的边界可能代表了相变。不过，相变分析更侧重于转变的动态过程，并假定涌现行为在某些相中显而易见，而在其他相中不存在。相比之下，本文重点在于通过物理测量检测涌现程度。

5.3 必要的宏观变量

格兰杰涌现方法另一个局限性在于，其使用必须指定系统的宏观变量，而无法自己发现系统的宏观变量，即无法自己学习粗粒化函数。

6. 与其他测量方法的关系

6.1 宏观预测

有学者[23]认为，预测能力的差异在定义宏观层次属性时可能至关重要。不过，他们的研究主要聚焦于澄清宏观状态的概念，而不是明确结合自主性和因果依赖的测量。相比之下，他们的预测效率测量是基于信息理论模型重构的，虽然很强大，但在实际应用中比本文提到的时间序列度量更复杂。类似的，Polani[24]提出的“涌现描述”还进一步涉及将系统分解为独立的信息子成分。

6.2 情境涌现

根据 Atmanspacher[25]提出的“情境涌现” (contextual emergence)，推导宏观属性需要结合微观属性和特定情境条件（这些条件通过动力系统分析中的稳定性标准来定义）。这一概念不同于因果基础论，它表明微观属性只是推导宏观属性的必要但非充分条件，这暗示了强涌现的存在。

6.3 多尺度系统熵

Bar-Yam[26]提出了一种测量强涌现的方法，基于在多尺度上测量系统的熵。多尺度多样性的波动被认为揭示了不同变量值之间的约束，而这些约束在单独的变量中不存在，且被认为是强涌现的标志。然而，考虑到强涌现本质上拒绝机械解释，全面分析 Bar-Yam 的测量方法超出了本文的讨论范围。

7. 在意识与强涌现领域的潜在应用

在科学研究中，强涌现是一个引人注目的概念，它描述了一种属性：这种属性不仅无法从微观层面推导，还会对微观成分产生“向下因果作用”[27]。这类现象挑战了传统科学方法，因为它暗示世界中可能存在一些无法用现有物理规律解释的真实属性。哲学家David Chalmers提出，意识可能是唯一明确的强涌现现象[8]。这种观点主要基于两个直观的感受：第一，即使完全了解大脑的物理互动，也无法回答“有意识的体验是什么感觉”。这种困惑被称为“意识的难题”。第二，意识似乎具有因果作用，比如我们认为自由意志能够影响我们的行为。这两点对应了强涌现的关键特征：宏观属性无法从微观中还原，并且具有不可替代的因果力量。

然而，这些直觉并不无可争议。科学理论的目标并非再现体验本身，就像飓风理论并不需要成为飓风一样[28]。尽管意识的“体验层面”可能是不可还原的，这并不会阻碍科学家揭示其机制。此外，意识并不一定需要“向下因果作用”来发挥作用。某些神经机制可能在功能效用的同时，伴随着意识体验的产生[28]。例如，研究表明，大脑通过整合大量信息，可以在短时间内对外部环境做出高效反应，而这种信息整合可能自然带来意识体验[22]。类似地，自由意志可能只是意识的一种主观体验而非真正的因果力量，因为实验显示在我们感知到自主行为之前相关的神经活动已经发生[29]。

相比之下，意识的许多特性更符合弱涌现的特征。例如，意识体验整体上看起来像是“整体大于部分之和”，并且具有一种独特的时间流动感（心理学家William James称之为“意识流”[30]）。基于弱涌现的模型可以通过研究大脑神经机制的动态过程，如“解释关联” (explanatory correlates) [28]，逐步揭示意识的特性是一个非常有前途的方向。

8. 总结

科学研究的进展依赖于对现象的测量能力。然而，涌现一直难以形成可靠的测量方法，特别是在强涌现领域，人们对其复杂性和不可还原性存在较大的怀疑。这些问题让强涌现的测量方法在应用和解释上变得异常困难[26]。本文提出了一种名为G-涌现的弱涌现测量方法，旨在通过线性和非线性时间序列分析直观地量化涌现属性。以鸟群飞行模拟为例，高G-涌现值与视觉上引人注目的鸟群行为相关联，甚至在一定条件下表现出从整体到局部的向下因果作用。G-涌现的潜力不仅限于鸟群模拟，还为研究其他涌现现象提供了平台，例如通过比较不同时期的G-涌现值，科学家可以更好地衡量涌现的动态变化与自组织行为。通过这种方法，研究者有机会逐步弥合微观神经机制与宏观意识体验之间的解释鸿沟，为意识及其相关现象的科学探索开辟更加清晰的道路。

参考文献

Seth A. K. (2008). Measuring emergence via nonlinear Granger causality. Proceedings of the Ninth European Conference on Artificial Life. Springer-Verlag. pp. 475–485.
Broad C, ed. (1925). The mind and its place in nature. London: Routledge and Kegan Paul.
Kim J (1999). "Making sense of emergence". Philosophical Studies. 95 (3–36).
Bedau M (2003). "Downward causation and the autonomy of weak emergence". Principia. 6 (5–50).
Chang H, ed. (2004). Inventing temperature: Measurement and scientific progress. New York, NY: Oxford University Press.
Hoel E.P., Albantakis L., Tononi G. (2013). "Quantifying causal emergence shows that macro can beat micro". Proceedings of the National Academy of Sciences of the United States of America. 110 (49): 19790–19795.
Bedau M (1997). "Weak emergence". Philosophical Perspectives. 11: 375–399.
Chalmers D (2006). The re-emergence of emergence. Oxford: Oxford University Press.
Jackson F; Pettit P (1992). "In defence of explanatory ecumenism". Economics and Philosophy. 8 (1–21).
Sperry R (1969). "A modified concept of consciousness". Psychological Review. 76 (532–536).
Granger C (1969). "Investigating causal relations by econometric models and cross-spectral methods". Econometrica. 37: 424–438.
Seth A (2007). "Granger causality". Scholarpedia. 2 (7): 1667.
Ding M; Chen Y; Bressler S (2006). Granger causality: Basic theory and application to neuroscience. Wienheim: Wiley. p. 438–460.
Seth A (2008). "Causal networks in simulated neural systems". Cognitive Neurodynamics. 2 (49–64).
Seth A (2007). Almeida e Costa F (ed.). Measuring autonomy via multivariate autoregressive modelling. Proceedings of the Ninth European Conference on Artificial Life. Springer-Verlag. p. 475–485.
Varela F (1979). Principles of biological autonomy. North Holland, NY: Elsevier.
Bertschinger N; Olbrich E; Ay N; Jost J (2008). "Autonomy: an information theoretic perspective". Biosystems.
Ancona N; Marinazzo D; Stramaglia S (2004). "Radial basis function approaches to nonlinear granger causality of time series". Physical Review E. 70 (056221).
Reynolds C (1987). Flocks, herds, and schools: A distributed behavioral model. Computer Graphics. Vol. 21. p. 25–34.
Seth A (2005). "Causal connectivity of evolved neural networks during behavior". Network: Computation in Neural Systems. 16 (35–54).
Vicsek T; Czirok A; Ben-Jacob E; Cohen I; Shochet O (1995). "Novel type of phase transition in a system of self-driven particles". Physical Review Letters. 75 (1226).
Edelman G (2003). "Naturalizing consciousness: A theoretical framework". Proceedings of the National Academy of Sciences, USA. 100 (9): 5520–5524.
Shalizi C; Moore C (2006). "What is a macrostate: Subjective observations and objective dynamics".
Polani D (2006). "Emergence, intrinsic structure of information, and agenthood". Interjournal Complex Systems: 1973.
Atmanspacher H (2007). "Contextual emergence from physics to cognitive neuroscience". Journal of consciousness studies. 14 (18–36).
Bar-Yam Y (2004). "A mathematical theory of strong emergence using multiscale variety". Complexity. 9 (6): 15–24.
Kim J (2006). "Emergence: core ideas and issues". Synthese. 151 (547–559).
Seth A; Edelman G (2008). Meyers R. ed. Consciousness and complexity. Springer Verlag.
Libet B (1985). "Unconscious cerebral initiative and the role of conscious will in voluntary action". Behavioral and Brain Sciences. 8 (529–566).
James W (1890). The Principles of Psychology. 1 & 2. New York: Henry Holt and Company.

（参考文献可上下滑动查看）

“复杂 AI 次方”开放实验室招募

作为北师大系统科学学院教授、集智俱乐部与集智学园创始人、集智科学研究中心院长，张江从2003年开始长期从事有关复杂系统建模的工作。近年来，张江带领着北师大的研究组开始聚焦在基于新兴AI技术进行基于数据驱动的自动建模研究，并立志破解复杂系统的涌现之谜。我们希望可以有对复杂系统自动建模领域有热情，且认可这个领域发展前景的朋友一起来合作，促进这一领域的快速发展。我们希望这个叫做“ Complexity ^AI ”，中文叫做“复杂AI次方”的开放实验室，能够真正实现思想共享、资源共享、跨学科交叉，共同为复杂系统自动建模而奋进。

哲学园

哲学是爱智慧，爱智慧乃是对心灵的驯化。这里是理念的在场、诗意的栖居地。关注哲学园，认识你自己。