意识的贝叶斯理论:寻找最小统一模型的综述

科技   2024-11-21 17:57   上海  
Special Issue: Consciousness science and its theories
Bayesian theories of consciousness: a review in search for a minimal unifying model
专题:意识科学及其理论
意识的贝叶斯理论:寻找最小统一模型的综述


以一种更广泛但相当有争议的方式:精确度和复杂性构成了一般意识的最小统一模型(MUM)。贝叶斯意识方法与更经典的账户之间的密切关系表明,一旦我们接受将贝叶斯认知科学解释为一个框架或工具箱,就有一大群理论可以通过精确度和复杂性来扩展。


总体情况如下:
1. 意识感知的内涵取决于对世界状态的不同假设所赋予的后验概率(B-AST, WH, PGNW, GE, 和 PCM),
2. 由于行动的迫切性,可能性的范围被简化为串行处理(WH 和 GE),
a. 然而,对这一选定假设的访问由不同处理流精度的加权管理,
这种加权可以表现为注意力(B-AST, HOSS, 和 PGNW),并且可能发生在事后,即在存储点(B-AST 和 DAM)。
3. 为了有效管理精度,需要一个更高层次的模型来进行精度优化。它可以采取元模型(WH)、自我模型(GE 和 DAM)、注意力模式(B-AST)或模型中的更高层次状态(HOSS)的形式。
4. 该模型的内容保持在中间层次,平衡了精度和复杂性,并允许主动推理提供最优策略(B-AST, GE, IWMT, 和 DAM)。同时,该模型不被任何更高层次的过程访问,因此保持在信息处理层次结构的顶层(B-AST, HOSS, GE, 和 IWMT),即使其内容被传递以进行进一步处理。
5. 该模型的结构是“特殊”、“不可言喻”的意识体验的来源(B-AST, GE, 和 IWMT),
a. 然而,它不一定扩散该模型预测的形而上学现实,表现为感受质(GE)或感觉(DAM),这些感受质或感觉与“猫”或“电脑”等对象的感知一样真实(GE)。



摘要

本文的目标是回顾在预测处理、主动推理和自由能原理框架内关于意识的现有工作。重点放在内部生成模型的精度和复杂性所扮演的角色上。在这些提议的背景下,这两个属性似乎是意识体验出现所需的最小必要组成部分——意识的最小统一模型。

关键词:意识;自由能原理;主动推理;预测处理;计算解释;最小统一模型。

MUM(Minimal Unifying Model of consciousness


引言

[这并不神秘,这只是对事物存在方式的数学表述。](Friston等人,2020年,第11页)

本文的目标是提供一份关于意识的研究综述——特别关注现象意识(Block,1995年)——这些研究迄今为止已在自由能原理(FEP)的形式框架内进行(例如Friston,2009年、2010年、2019年)。

在过去15年中,FEP——连同源自同一理论核心的相关框架,即预测处理(PP;例如Hohwy,2013年;Clark,2016年;Wiese和Metzinger,2017年)和主动推理框架(例如Friston等人,2017a)——已经成为认知神经科学、神经生物学和心灵哲学中的中心方法之一,并且成为人工智能,特别是强化学习中日益重要的方法(例如Ueltzhoffer,2018年;Millidge,2019年)。我将根据Ramstead等人(2020年)的命名,将这些理论称为“贝叶斯认知科学”,尽管FEP并不涵盖所有“贝叶斯”认知和意识理论的可能性。尽管关于这个框架的总体可行性和实际意义有很多争论(例如Colombo和Wright,2018年;Litwin和Miłkowski,2020年;Andrews,2021年),但目前看来,它将在可预见的未来持续存在。

在最近的一篇论文中,Hohwy(2020年)讨论了FEP的当前焦点,以及在此框架内出现的新的研究领域。其中,他列出了关于意识的日益增长的工作量。这些工作涵盖了几个相互排斥的关于主观体验的哲学观点,同时也触及了它们共同关注的问题,例如识别意识的神经相关性(Hohwy和Seth,2020年)。在这项工作中,FEP展现了它的“吸引力二元性”(Hohwy,2020年,第11页)——即它与现有论证线的正交性

令人惊讶的是,尽管存在差异,所有这些提议都基于FEP形式主义的相似元素——特别是“精度”和“复杂性”(这两个术语的技术意义将在下一节中描述)。Wanja Wiese(2020年)提出了“最小统一模型”的概念,作为建立各种意识解释之间共识的框架。在本文中,我将回顾贝叶斯认知科学中关于意识的现有工作。基于这篇综述,我将论证这些内部模型的两个属性——精度和复杂性——实际上构成了至少对贝叶斯认知意识科学的最小统一模型。通过这种方式,这些工作可以被解释为对意识的神经机制做出连贯的(尽管有限的)可经验检验的预测。

接下来,在“FEP的非常简短介绍”部分,我将提供FEP的非常简短的介绍,重点关注贝叶斯认知科学的三个框架的共同元素。在“FEP下的现象体验”部分,我将概述采用这些框架的意识理论。在“讨论”部分,我将讨论贝叶斯意识理论的一般情况,尝试在这些不同的解释中指向一个共同的方法。最后,在“精度和复杂性作为最小统一模型”部分,我将讨论这个共同方法的核心在最小统一模型方面的解释,我认为这是最具信息量的。


自由能原理(FEP)的非常简短介绍

自由能原理(FEP)(Friston,2019)陈述了一个简单的同义反复:任何生命系统,只要它继续存活,就可以被描述为最小化其组成状态的分散。为了这个定义的目的,“生命系统”被理解为处于非平衡稳态(NESS),并且保持存活意味着维持这种状态。为了做到这一点,系统必须保持远离热力学平衡(因此是同义反复),处于(相对)低熵状态。此外,FEP实现了Good Regulator定理(Conant和Ross Ashby,1970),该定理指出,系统的每一个好的调节器必须与该系统同构(即必须是该系统的模型)。只要它保持远离热力学平衡,系统就好像采用了或实例化了一个生成模型,一个内部的统计表示目标NESS密度(和世界的影响)。有效地,系统可以被描述为能够预测它所经历的变化和适应性行为。该原理已被应用于广泛的自组织系统(例如Friston和Stephan,2007;Friston,2013;Friston等人,2015a;Kirchhoff和Kiverstein,2018;Fields和Levin,2019)。然而,从科学哲学的角度来看,它最好被视为一个建模框架,而不是模型本身[Litwin和Miłkowski(2020)和Andrews(2021)在这方面提出了有力的论点]。

关于认知,“贝叶斯认知科学”将大脑描绘为一个层次化的“预测机器”。利用其对世界状态的信息,特别是关于感觉输入的隐藏原因——形式上由被称为识别密度和生成模型的概率分布表示——大脑(或具身认知系统)试图预测即将到来的刺激。预测和输入之间的不匹配,即预测误差,然后从底层向上传递到神经层级,并用于通过更新内部模型本身——知觉推断——或通过与世界的积极互动——主动推断——来使识别密度更接近实际原因分布,后者试图使隐藏原因更接近生成密度(可以将其视为自我实现的预言)。自上而下的预测和自下而上的预测误差之间的相互作用是框架应用于实际神经回路的核心,如视觉的预测编码模型(Rao和Ballard,1999)。

预测误差表明了惊讶(在信息论的技术意义上,数学上等同于熵),这表明系统正在离开NESS。因此,最小化惊讶严格遵循FEP的表述。然而,由于这个值是难以处理的,必须使用近似值。(变分)自由能通过测量识别和生成密度之间的差异,提供了惊讶的上界。

这种自由能函数可以被正式分解为两种等价的表述(参见例如Friston,2009),对应于上述的知觉和主动推断,可以象征性地表示为:

后者的分解对我们目前的目的至关重要。

这些术语定义如下:

复杂性表示在完全了解识别密度的情况下,重建生成密度所需的信息量(用两个密度之间的Kullback-Leibler散度来量化)。

准确性表示内部模型生成的预测与实际观测概率分布的接近程度,这是在给定隐藏原因的情况下。

因此,主动推断的过程可以被理解为选择性地采样世界,使感觉更接近预期(请注意,在整个文章中,“精度”和“复杂性”这两个术语仅在此处和下文中描述的技术意义上使用)。

然而,准确性的提高必然伴随着复杂性的增加以及过度拟合内部模型的风险。这一事实简单地来自于世界的不可约不确定性和随机性。为了考虑这一点,模型必须放弃一些准确性(和复杂性)以换取鲁棒性。

在我继续讨论贝叶斯认知科学如何解释意识之前,我将提供一个使用FEP(大致属于PP标签)解释注意力的例子,展示这个框架的关键组成部分,并引入稍后将证明为中心的进一步概念。


在自由能原理下的注意力

预测处理(PP)用赋予自上而下的假设和自下而上的预测误差信号的精度控制来解释注意力(Feldman和Friston 2010;Hohwy 2012, 2013)。正式地说,精度是概率分布的逆方差。精度最显著地描述了预测误差信号(感觉噪声)和从生成密度产生的假设(神经噪声)的可靠性。尽管这两种情况在形式上都以逆方差来定义,但精度分配是独立的,因此必须由认知系统独立跟踪。

在更复杂的主动推断案例中,Parr和Friston(2017a,b)识别出三种类型的精度分配,最重要的是感觉和预期自由能精度(见也Smith等人2021),它们与大脑中不同的神经递质系统相关,并负责注意力机制(Parr和Friston 2017b)。

由于精度不是给定的,需要从可用数据中推断出来,它们也受到系统本身的控制——尤其是因为它们在上下文和感觉模式之间是易变的。正如我们从Good Regulator定理中学到的,如果大脑应该管理精度预期(在次个人层面上),那么它们必须以某种方式被建模——要么直接地,以精度预期的形式(正如Hohwy 2012所争论的),要么间接地,以生成密度的超参数的形式(Buckley等人2017)。这个过程也可以被视为某种脱节和独立的,因此被解释为一个专门用于管理精度的模型(这一点被Dołe˛ga和Dewhurst 2019利用,如下文所述)。

根据这种描述,外源性注意力——对具有大空间和/或时间对比度(突然发生)的刺激的体验——由于预期更强的信号应该具有更大的信噪比,因此具有更好的(感觉)精度。另一方面,内源性注意力——自上而下、内部控制的焦点分配——通过直接调节编码信念的神经单元的反应来操作(预期自由能)精度(Hohwy 2012, 7),有效地为相关的时空区域分配更高的精度。

Hohwy(2012)讨论了几个不注意盲的例子,详细说明了这种注意力账户如何解释它们。在这里,我将简要回顾他关于变化盲的解释,使上述有点正式的讨论更加接地气。

考虑一个实验,参与者被呈现两张相似的飞机图像。第二张图像的区别在于它被泥点覆盖,以及所描绘的飞机缺少一个引擎。由于干扰物——泥点——提供了一个强信号,并且是一个相对更可见(更大或更显著)的变化,比缺失的引擎更明显,它将“抓住”注意力,即对应信号的部分将被赋予高精度。结果,这个变化将激活一个关于世界的特定假设——参与者被呈现了一个短暂的遮挡或照片的变化,有一个强烈的信念,即泥点下的照片保持不变。只有在这一假设被接受为模型,并且对应于泥点意外出现的预测误差被解释之后,对应于引擎缺失的微妙变化才能被赋予更高的精度,从而——可以引起参与者的注意。


在自由能原理下的意识体验

有几种竞争模型试图利用贝叶斯认知科学提供的工具来解释意识体验——特别是现象意识。这些模型包括:

1. 格拉齐亚诺注意力模式理论的贝叶斯实现(B-AST)(Graziano 2013; Dołe˛ga 和 Dewhurst 2019, 2020);

2. 高阶状态空间方法(HOSS)(Fleming 2020);

3. “获胜假设”(WH)账户(Hohwy 2012, 2013);

4. 预测全局神经元工作区理论(PGNW)(Hohwy 2013, 2015; Whyte 2019; Whyte 和 Smith 2021);

5. “生成纠缠”(GE)账户(Clark 2018, 2019; Clark 等人 2019);

6. 投影意识模型(PCM)(Rudrauf 等人 2017, 2020; Williford 等人 2018);

7. 综合世界建模理论(IWMT)(Safron 2020);

8. 双重本质一元论(DAM)(Solms 和 Friston 2018; Solms 2019; 另见 Chanes 和 Barrett 2016);

9. 马尔可夫一元论(MM)(Friston 等人 2020)。

1. Bayesian implementation of Graziano’s Attention Schema 
Theory (B-AST) (Graziano 2013; Dołe ̨ga and Dewhurst 2019,
2020);
2. higher-order order state space approach (HOSS) (Fleming
2020);
3. the “winning hypothesis” (WH) account (Hohwy 2012, 2013);
4. Predictive Global Neuronal Workspace theory (PGNW)
(Hohwy 2013, 2015; Whyte 2019; Whyte and Smith 2021);
5. the “generative entanglement” (GE) account (Clark 2018,
2019; Clark et al. 2019);
6. Projective Consciousness Model (PCM) (Rudrauf et al. 2017,
2020; Williford et al. 2018);
7. Integrated World Modeling Theory (IWMT) (Safron 2020);
8. Dual Aspect Monism (DAM) (Solms and Friston 2018; Solms
2019; see also Chanes and Barrett 2016);
9. Markovian Monism (MM) (Friston et al. 2020).


上述列表大致按照这些解释的现实主义程度排列——正如我之前提到的,FEP对意识的研究具有“吸引力二元性”,因为它与现有的区分正交。空间考虑不允许对上述所有账户进行充分讨论。然而,我将尝试提供每个账户的要点。

需要注意的是,这些账户涉及现象意识的不同方面,因此它们并不完全相互竞争。然而,它们中的许多在某些方面重叠,为类似问题提供了不一致的解决方案。

最后,一个重要的警告:下面讨论的许多意识理论遵循FEP的现实主义解释,认为大脑(或具身认知系统)实际上确实执行自由能(FE)最小化——例如Williford等人(2018)使用“某种量正在被优化”的主张来为心智计算理论的现实主义辩护。在某些情况下,这得到了作者对FEP特定过程理论(PP和主动推理框架;参见Andrews 2021)的依赖的证明;然而,一般来说,这种方法经不起审查[正如Andrews(2021)和van Es(2020)令人信服地论证的那样]。

贝叶斯注意力模式理论(AST)

AST最初由Graziano(2013)提出。在这个观点下,意识是主观意识,它源于主体对某个刺激的关注。更准确地说,访问意识是通过注意力实现的,而与相关现象学的第一人称体验结构是通过控制注意力的过程的属性来解释的。注意力的控制依赖于一个名为“注意力模式”的内部模型,它类似于身体模式的内部模型。这意味着主体可以访问一个简化的模型,了解注意力是如何部署的,每当需要报告它意识到什么时,它都可以查看这个模型。而且,根据AST,每当我们声称意识到某事物时,我们实际上是在使用高阶认知来“内省”我们的注意力模式,并报告它包含的信息。这个提议与上述PP对注意力的解释很好地吻合,因此最近提出了AST的贝叶斯实现(Dołe˛ga和Dewhurst 2019, 2020)。

原始AST及其PP形式化的关键部分是对现象意识“特殊”特征来源的解释。注意力模式以稀疏的方式代表注意力过程,因为其任务是控制感知和认知系统,这不需要完全详细的表示。Dołe˛ga和Dewhurst指出,这种“节俭”实际上是PP认知模型的一个必要要求——它确保了复杂性和准确性之间的适当平衡。根据AST,这种稀疏性导致了关于现象体验有一些特殊、非功能性和不可约约的“用户幻觉”(Dennett 1991)。与下面讨论的WH账户相反,他们进一步融入了丹尼尔·丹尼特的多重草图意识观点(Dennett 1991),认为不仅仅是最好的假设成为了意识感知的内容。

首先,主动推理需要减少可能性的空间,然后注意力才能真正探测这些假设。这将“大脑中的名声”(Dołe˛ga和Dewhurst 2020)的解释与注意力模式理论(AST)联系起来,提供了一个成熟的对现象性幻觉严肃对待的意识的放气理论。

高阶状态空间方法(HOSS)由Stephen M. Fleming提出,直接针对主观体验内容的报告性问题。Fleming提出了一个计算模型,解释了为何会报告“我意识到X”与“我没有意识到X”的决定。他的核心观点是“意识是感知内容的生成模型中的高阶状态”。这意味着意识被明确地作为一个一维的(离散或连续的,如果我们允许意识程度的话)内部随机变量,包含在比追踪经验感知内容的变量更高阶的生成模型中。Fleming的模型模拟显示,其能够解释与意识相关联的全局点火现象(这是不同全局工作区理论的一个重要元素;见下文)。

Fleming的模型直接包含了意识到和未意识到之间的不对称性。作者声称,意识到苹果和意识到锤子是两种不同状态,无论是在现象上还是功能上,而未意识到苹果和未意识到锤子则非常相似。这对预测编码(PP)中感知的预测误差有影响:系统意识到的假设允许更大的预测误差,因为它在生成模型中调用了大的信念更新。Fleming的模拟显示这些预测是正确的,他将系统接受“看到”与“未看到”假设时出现的大的Kullback-Leibler散度解释为与大脑中报告意识到的点火模式相对应的。

Fleming进一步提出了与精度相关的联系,作为他模型的可能扩展。他指出,关于意识状态的推断可以通过关于注意力和其他感知系统状态的信念来辅助,他建议这可以作为关于精度的信念来实现。通过这种方式,他将自己的提议与Graziano的AST联系起来(见前一节),尽管根据HOSS,注意力只提供“解决歧义的输入”,不足以确定意识,这是理论之间的一个显著不一致之处。

Fleming的账户,只要它可以超越它所关注的意识模型,就建立在高阶意识理论(例如Lau 2007)之上。这将这一提议与其他讨论的贝叶斯意识账户区分开来。HOSS将意识视为一个高阶的推断过程,可能在没有任何积极的认知访问到这些信息的情况下发生,例如在工作记忆中。这限制了允许意识过程发生的认知架构的种类:它们必须允许沿着至少两个线(存在/缺失和感知内容)的丰富多维状态空间的因式分解。这种因式分解可能在计算上要求很高,因此限制了可能被认为是有意识的认知系统的种类。它还引入了HOSS的复杂性,可以通过施加状态区分数量的上限来控制这种因式分解是如何执行的,尽管Fleming没有明确这种联系。


获胜假设账户

意识知觉体验的获胜假设(WH)账户最初在Jakob Hohwy及其合作者的双眼竞争的开创性论文中被暗示(Hohwy等人,2008年;在Hohwy,2012年,2013年进一步发展)。它关注访问意识(Block,1995年)并不讨论支持现象体验的心理过程。

主要观点是,意识体验的内容由关于世界状态的假设决定,该假设目前具有最高后验概率,即大脑的最佳猜测。每个关于世界状态的假设都可以根据推理的第一和第二阶统计量沿两个独立维度进行评估——即,它可以既准确又精确。Hohwy(2012年)声称,为了构成意识知觉,假设必须在这两个维度上都得分相对较高(见Hohwy,2012年图1),因此——因为如上所述,在PP框架中精度反映注意力——知觉必须被主体积极关注。

这在双眼竞争的PP故事中最为明显,这是一种当受试者被呈现两个不同的视觉刺激到每只眼睛时发生的知觉现象,例如一张房子的图片和一张脸的图片。受试者在任何时刻有意识地感知到的要么是一张脸,要么是一座房子,而且随着时间的推移,知觉的内容在两个图像之间波动。PP(Hohwy等人,2008年)通过指出这两个刺激对应于两个关于世界状态的不同假设来解释这一现象。此外,这些假设是相互排斥的(由于强烈的先验期望,没有两个物体可以占据同一空间,而且脸和房子是不同的物体)。大脑必须接受其中一个猜测,留下大量的预测误差。这种预测误差使推断变得不稳定,最终导致切换到第二好的猜测,然而,这并没有解释所有的输入,因此仍然是不稳定的。

这个账户已经被Parr等人(2019a)扩展,并应用于Troxler褪色现象,其中静态注视导致外围刺激的褪色体验。WH的选择与行动和主动推断密切相关(如在下文关于GE账户的部分更详细讨论)。Parr和同事强调双眼竞争似乎与Troxler褪色相似,其中知觉的切换是由于眼睛在图像周围移动——一种公开的行动。在前一种现象中,知觉的转变可能被认为是隐性行动的结果,即注意力的转移。这强调了WH账户中精度控制的作用,不仅可能与GE方法建立联系,还可能与B-AST建立联系。


预测全局神经元工作区理论

WH提案进一步扩展并与全局神经元工作区理论[Dehaene和Changeux 2011;PGNW由Hohwy(2013;2015),Whyte(2019)和Whyte和Smith(2021)发展]相整合。这两个账户分别讨论,因为WH在文献中也作为一个独立的提案出现,没有参考全局工作区理论的更大框架。

全局工作区是关于信息交换机制的一个提议,该机制存在于其他孤立的大脑区域和过程之间。理论指出,要成为意识,信息必须进入这个在全球工作区中实现的“在密集连接的锥体神经元网络中,拥有连接前额叶和顶叶皮层的长程兴奋性轴突”(Whyte 2019, 4;见Dehaene和Changeux 2011)。串行信息处理(导致“意识流”的体验)来自于对竞争输入过程的抑制。模型的核心预测是,感觉皮层中的初始局部活动对应于无意识的刺激处理,而意识访问出现在依赖于前额叶-顶叶网络全局激活的相对较晚的时间窗口。

Dehaene(2008)提出,晚期点火对应于关于世界状态假设的证据积累。Hohwy(2013)进一步补充了这一提案,强调了行动的作用。在他的账户中,点火对应于一个给定假设积累了足够证据以保证从感知推断到主动推断的转变(见也Whyte 2019)。选择最佳的行动策略需要保持关于世界状态的假设固定。这也表明,应该从全局工作区到感觉输入有自上而下的连接,这些连接携带关于意识内容的假设。这种方法提供了一个关于全局点火背后的机制的不同假设,与HOSS的提案不同,直接的实证比较将是有益的。一种可能的方法是通过设计一个对刺激状态空间的粒度有精细控制的实验,以便对存在和缺失的预测会导致相等的预测误差量。在这种情况下,根据HOSS,实际上不会出现点火。然而,鉴于选择的刺激方式是它们的出现和缺失都引发了对行动的需求——和主动推断,如果PGNW是正确的,点火仍然会出现,就好像大脑固定了关于世界状态的最佳猜测一样。

在一个重要的研究中,Whyte和Smith(2021)提供了基于主动推理框架(Parr等人,2019b)的最新版本的PGNW的实现,对视觉意识进行模拟。他们的模型模拟了现象掩蔽和不注意盲实验的电生理和行为结果。这为PGNW背后的想法提供了初步的实证支持,因为模拟结果与从人类参与者收集的实证数据吻合得很好。在论文中,作者还进一步发展了PGNW中精度的作用,展示了不同水平的信号强度(感觉可能性的精度,即感觉精度)和注意力(假设的精度,即预期自由能精度)对应于GNW内提出的标准分类,影响意识访问的因素(Dehaene等人,2006)。此外,作者通过讨论时间深度的作用扩展了PGNW模型,这在他们对意识体验报告的解释中是必要的(另见综合世界建模理论部分)。通过这种方式,他们能够以在足够深的时间层面上发生的推理过程来定义意识访问,以允许在较浅层面上的信息处理进行整合和情境化(Whyte和Smith,2021,13)。

PGNW不仅与非预测版本的神经科学证据一致,而且还提供了几个独特的假设:(i)意识表征应该与层次结构较低级别的处理连续,(ii)预期的一致性影响与主观报告相关的P3事件相关电位成分的幅度(Whyte和Smith,2021,12),以及(iii)根据对刺激的不确定性,前额叶和顶叶区域之间的活动动态将显著不同,对应于分配给预测(靠近大脑前部)或预测误差(在顶叶区域)的精度(Whyte,2019)。


生成纠缠账户

Andy Clark已经发展了一种关于现象意识问题的不同视角(Clark 2018, 2019; Clark et al. 2019)。

Clark的账户与WH账户在某些表面特征上相似,即意识的内容取决于认知系统对世界状态的“最佳假设”。然而,这种方法的独特之处在于将GE(Clark 2019)视为现象性的来源。鉴于预测环境状态的任务,其中主体——认知系统本身——扮演着重要的因果角色,系统需要维持一个自我模型,能够预测其自身状态、“反应复合体”或“倾向”(Clark 2019, 653),以响应某些结构化的感觉流动模式,其中内脏感觉、外感觉和本体感觉输入保持纠缠。由于这种纠缠和由此产生的复杂性,反应倾向被建模为粗粒度的、缩写的或潜在变量,用于那些流入。换句话说:它们构成了系统关于世界状态的中级假设(Clark et al. 2019)。

这些“感受质”对代理来说令人困惑,原因有几个。首先,这些中级推断在确定世界的实际状态时存在不确定性,但对系统本身却非常确定(即,它们被赋予了高精度)。结果,它们被视为仅仅是“外观”(Clark et al. 2019, 29),尽管如此,它们不能轻易“摆脱”。其次,由于这些假设模拟了系统自身的状态,因此不需要更高级别的模型来解释这些反应倾向是如何产生的——实际上也没有这样的模型(Clark 2019, 655)。结果,系统只能访问最终估计。“感受质”是一个简化的自我模型的元素,旨在准确且简洁,以指导未来的选择和行动。

将现象意识的内容置于信息处理层次结构的中间或中级水平的观点有着更长的历史,最初由Jackendoff(1987)提出,后来由Prinz(2012)重复。这一观点经常因为难以根据提出的标准界定所假设的中间水平而受到批评(Marchi和Newen 2016)。然而,Marchi和Hohwy(2020)表明,主动推理的概念提供了对现象意识范围的明确识别,就人类而言,实际上就是中间的。这个想法将Clark的GE与Hohwy的WH账户联系起来。意识的内容取决于最佳假设,为了主动推理的目的而保持固定。同时,每个生物体都有一个特权的时空尺度,主动推理在此尺度上运作,这取决于生物体的行为倾向的组织。就人类而言,Marchi和Hohwy将这个特权尺度与直观上的“基本”行动联系起来:伸手、抓取、迈步、转身、蹲下等。因此,为了让主动推理能够为生物体提供最优策略,指定意识体验内容的假设也必须在这个时空水平上明确表述。就人类而言,这实际上对应于中间水平,以及Marr的“2.5d草图”(Marr 1982;见Marchi和Hohwy 2020)。

Je˛czminska(2017)提出了一个与GE账户方案相符合的略有不同的提议。

Je˛czminska利用Clark发展的PP框架版本,主张通过将全局工作区理论(Baars 1997年版本)与感觉运动理论(O’Regan和Noë 2001年发展)的交叉,提供一种全新的、扩展的意识体验理论的可能性。

然而,这个账户缺乏细节,其主要贡献归结为强调大脑中不同感觉模式数据持续整合的重要性及其在指导行动中的作用。


投影意识模型(PCM)

PCM最初由David Rudrauf与几位合作者——最重要的是Kenneth Williford和Daniel Bennequin(Rudrauf等人,2017, 2020; Williford等人,2018)构思。虽然该模型严重依赖于FEP提出的心智观,但它提出的意识解释的核心部分来自几何考虑。

PCM接受了主动推理框架对无意识处理、行为控制和意识功能角色(被认为是促进自由能最小化)的解释。然而,主动推理框架的标准账户通过讨论生成模型的内部几何学得到了扩展。

PCM遵循(神经)现象学的计划,识别意识体验的现象不变量(Williford等人,2018, 3),并将它们假设为理论的公理和解释对象。通过这种方式,模型接受了关注意识问题的概念化,集中在意识体验的空间(在空间意义上的视角)和意向性元素。这种视角性导致Rudrauf等人(2017)接受生活空间是非欧几里得的,并且更好地被投影几何描述——一种最初由文艺复兴时期的建筑师和画家发展,目前在虚拟现实和计算机图形研究中重要的非欧几里得几何。因此,根据PCM,为了使生成模型能够支持意识体验,它必须具有由投影几何规定的形态。更正式地说,他们提出了“意识场”的概念,这是一个由特定向量空间定义的三维投影空间,对应于视点。透视取向的心理过程因此对应于投影变换(即空间向不同视点及其相关向量空间的几何变换),作者明确声称(Williford等人,2018)这样的变换是由大脑计算的(特别是由后皮质和皮质下结构;Rudrauf等人,2017)。作者讨论了几个应用框架的例子(例如视觉错觉,如Necker立方体和体外体验),并通过计算机模拟支持其合理性。

这个账户声明性地将全局工作区理论的元素与意识信息的中心可用性联系起来,并与集成信息观的元素(Rudrauf等人,2017; Williford等人,2018)相联系。此外,它与贝叶斯认知科学中的其他意识账户兼容,特别是与WH账户,因为Rudrauf等人(2017)使用WH账户来解释主体视角的独特性(即,它是能够解释最大预测误差的那个)。作者自己确定“投影变换和投影框架必然支持意识的出现和运作”(Williford等人,2018, 15)作为他们模型的关键新贡献。

Adam Safron的IWMT(Integrated World Modeling Theory,综合世界建模理论)是建立在主动推理框架(Active Inference Framework)和信息整合理论(Integrated Information Theory,IIT)的基础上,同时受到全局神经元工作区理论(Global Neuronal Workspace Theory,GNWT)等其他意识理论的强烈影响。IWMT试图通过将IIT与FEP-AI(自由能原理和主动推理框架)相结合来解决一些各自理论中存在的问题,例如IIT的泛心论后果。IWMT认为,只有当系统具有能够生成具有空间、时间和因果一致性的自我和世界的模型的视角参考框架时,综合信息才意味着意识。如果没有与外部现实的这种联系,系统可能具有非常高的综合信息量,但仍然不意味着主观体验。

IWMT的核心在于自我组织谐波模式(Self-Organizing Harmonic Modes,SOHMs),这是一种在大脑中实现综合信息复合体和全局工作区的机制。谐波模式是神经区域活动的同步,提供了这些区域之间的有效连接,并可能实现了自我证明。IWMT还提出了预测处理(Predictive Processing,PP)在皮层中的实现形式,即折叠的变分自编码器,其中内部表示对应于推断出的隐藏原因。这种算法的核心是降维,意味着世界模型的生成涉及降低相应概率密度的复杂性。

现象学上,IWMT提出了一种“非笛卡尔”剧场的观点,认为有一个内部的、非人类中心的观察者作为体验的主体。它将现象体验视为真实存在,由当前最大SOHM的状态实现,位于后内侧皮层。IWMT代表了一种综合的方法,通过揭示领先意识理论之间的兼容性,使得推断协同作用成为可能。


双重性一元论

双重本质一元论(Dual Aspect Monism)是Solms(2019)在与Friston(Solms和Friston,2018)的早期合作基础上提出的理论。根据这一理论,查默斯(Chalmers,1996)提出的意识的硬问题正确地指出了现象意识不能被简化为视觉或记忆的功能。然而,对于Solms来说,这并不意味着现象性本身没有功能,或者不能以功能术语来解释。

Solms的主要观点可以重构如下:意识的主观体验和大脑的生理过程都是某种其他抽象功能过程的不同表现,就像闪电和雷声是电放电的不同表现一样。患有水脑症的儿童,即完全去皮质的儿童,他们仍然保持清醒,并且他们的清醒状态具有某种定性——现象性方面,这从他们能够表现出情感状态这一事实中得到体现,这导致Solms将意识与“感觉”的功能等同起来,并将其定位在去皮质患者中仍然完好的皮层下结构中。

Solms认为,感觉的功能是使系统在不可预测的情境中实现稳态控制,他指出“意识就是感觉到的不确定性”(Solms,2019,7)。由于这种监控与生存相关,它本质上是价值负载的,并将那些导致生存(增加有机体的适应度)的行为和状态归类为好的。这导致了主观性(即只有从第一人称视角才能获得)以及体验的定性特征,后者源于有机体状态的分类变量化,使系统能够处理其自我模型日益增加的复杂性。最后,由于意识体验受到情境因素的影响,因此需要精度加权来控制预测误差,因此它是实现意识访问的机制。需要注意的是,在Solms的账户中,精度并不等同于注意力,而是实现注意力和动机的机制(Solms,2019,12)。

Solms模型中经验的稳态源的重要作用与之前将预测处理框架与全局神经元工作区理论联系起来的尝试形成了有趣的联系;“边缘工作区”的提议(Chanes和Barrett,2016;Whyte,2019指出这一提议与上述的PGNW在假设模型及其预测方面有所不同)。Chanes和Barrett(2016)关注边缘皮层(例如前岛叶、海马旁回和扣带皮层)在皮层处理和意识访问中的作用。作者建议,边缘皮层在选择表征时,考虑有机体的稳态需求和偏好。此外,由于这些大脑区域与皮层下结构以及其他皮层区域有双向连接,它们似乎是Solms模型的一个合理的扩展,将他对“感觉”的解释与大脑皮层的处理联系起来,展示了心理图像如何被赋予“它是什么感觉”。如果这种联系被证明是合理的,它将显著扩展Solms原始账户的范围。


马尔可夫一元论

MM(马尔可夫一元论)由Friston等人(2020)基于第一原理(Colombo和Wright,2018)提出,作为意识起源的理论。它不提供任何关于意识实现的机械或实施细节,而是展示了如何从FEP的原则中推导出感知(在弱意义上对感觉印象做出反应)的存在。具体来说,它声称感知是由马尔可夫毯的存在所推导出来的。此外,它是一个明确的关于现象性的形而上学账户(但参见Beni,2021年的批评)。

尽管MM在范围和方法上与其他论文不同,但它为贝叶斯认知科学所描绘的意识的一般图景提供了几个重要的洞见,因此需要一些讨论。

在这个综述中,我将关注这个账户的两个特征:以信息几何学描述的笛卡尔心灵二元性,以及Friston及其合作者对意识中精度的中心作用的引用。

笛卡尔心灵的二元性可以用两种视角来描述认知系统的可能性:第三人称的心理学、神经科学等视角,以及第一人称的主观体验视角。根据FEP,当我们考虑任何由马尔可夫毯所界定的系统时,这种划分就会出现——即那些使系统内部状态与任何其他事物条件独立的一组状态或变量。虽然Friston认为马尔可夫毯的存在对于每一个“事物”的存在是必要的,只要它能够被区分开来[例如,在他的专著(Friston,2019)中;但参见Bruineberg等人(2020)对这一提议的批判性分析],这里的一个关键洞见来自于这样一个事实:被界定的系统可以用自信息或惊讶度的梯度流来描述(大致来说,这是可能的,因为它是动态系统时间演化的标准描述——Fokker-Planck方程的稳态解)。与马尔可夫毯的存在一起,这为建模者提供了描述内部状态作为对外部状态建模的可能性,正如上面FEP介绍中所描述的那样。如果我们为这些统计流形配备一个费舍尔信息度量(通过累积从一点到另一点在流形上编码的分布之间的Kullback-Leibler散度来量化两点之间的距离),我们就在马尔可夫毯界定的系统上施加了一个信息几何学;但由于我们有两个独立的密度,我们实际上需要定义两个信息几何学——内在的,描述自主(即内部和主动)状态,由时间参数化,以及外在的,描述外部状态,由信念参数化——即内部状态。

虽然这只是原则上解释了为什么意识体验会出现,省略了实际人类体验的结构和实现,Friston等人(2020, 21-22)认为,这不仅展示了感知的起源,解释了现象质量的私人、主观特征,而且还包含了意识的几个标准,如IIT所描述的(例如,意识体验的独特性和统一性)。

关于意识的神经实现的具体细节在原文中只是简要讨论。作者指出,内部统计流形上的费舍尔信息度量是变分自由能的曲率。此外,他们声称这与外部状态信念的精度或信心是相同的参数。这种平行性没有详细的形式化阐述,而是归功于规范理论的工作(Sengupta等人,2016);然而,即使是上面提供的非正式的费舍尔信息度量定义,也应该能让读者大致理解显示这种等价性的考虑。这直接联系了MM的工作和上面描述的DAM的工作,以及几篇其他论文声称,例如精度在现象信念的不透明性或透明性中扮演关键角色(Limanowski和Friston,2018)。


讨论

贝叶斯认知科学为意识研究提供了五花八门的方法,这些方法在问题定义、涵盖现象的范围、形式化和/或实施细节的程度,以及观点的形而上学承诺方面存在差异。这些差异在表1中简要总结。这种情况与PP方法相对于当前神经科学和心灵哲学辩论的“正交性”相吻合,正如Jakob Hohwy(Hohwy 2020, 11)所说的那样。此外,研究人员积极利用这种二元性,他们不仅试图将PP账户与现有的主流意识理论联系起来,如全局神经元工作区理论或IIT,而且相信FEP可以在这些不一致的账户之间架起桥梁。

现在我将转向讨论贝叶斯认知科学家在意识工作上描绘的“更大的图景”,它所遇到的问题,以及可能的解释,即以最小统一模型的术语来理解。

贝叶斯认知科学中的意识研究

一旦我们将所有这些账户放在一起讨论,就会变得清楚的是,尽管它们存在差异,但它们对意识特定现象的形式解决方案在各个账户之间或多或少是相同的。具体来说,它们都同意,内部模型的精度(或精度优化)和复杂性是负责访问和现象意识的。

总体情况如下:

1. 意识感知的内涵取决于对世界状态的不同假设所赋予的后验概率(B-AST, WH, PGNW, GE, 和 PCM),
2. 由于行动的迫切性,可能性的范围被简化为串行处理(WH 和 GE),
a. 然而,对这一选定假设的访问由不同处理流精度的加权管理,
这种加权可以表现为注意力(B-AST, HOSS, 和 PGNW),并且可能发生在事后,即在存储点(B-AST 和 DAM)。
3. 为了有效管理精度,需要一个更高层次的模型来进行精度优化。它可以采取元模型(WH)、自我模型(GE 和 DAM)、注意力模式(B-AST)或模型中的更高层次状态(HOSS)的形式。
4. 该模型的内容保持在中间层次,平衡了精度和复杂性,并允许主动推理提供最优策略(B-AST, GE, IWMT, 和 DAM)。同时,该模型不被任何更高层次的过程访问,因此保持在信息处理层次结构的顶层(B-AST, HOSS, GE, 和 IWMT),即使其内容被传递以进行进一步处理。
5. 该模型的结构是“特殊”、“不可言喻”的意识体验的来源(B-AST, GE, 和 IWMT),
a. 然而,它不一定扩散该模型预测的形而上学现实,表现为感受质(GE)或感觉(DAM),这些感受质或感觉与“猫”或“电脑”等对象的感知一样真实(GE)。

显然,这些理论之间存在一些重要的分歧。仅指出最广泛的几点:

PCM(投影意识模型)并不将现象意识的存在归因于精度的元模型,而是归因于生成密度本身(它在第3-5点上存在异议)。

体验的“特殊”、“难以言喻”和“视角性”特征来自于模型的几何结构。然而,需要注意的是,PCM假设的几何变换可能正式上降低了模型的复杂性,因为这些变换专注于所谓的“句法”结构,同时忽略了一些细节。支持这种解释的一个可能的论点是PCM假设的投影变换不一定保持被变换对象的身份。此外,为了支持这一观点,可以认为这种模型假设的变换不是直接在大脑中计算的,而是使用降低复杂性的表示来近似的。

IWMT(综合世界建模理论)没有明确将访问意识与注意力和精度联系起来,而是将自组织谐波模式视为关键机制(它在第1-2点上存在异议)。虽然Safron的考虑——特别是关于神经节律特定频率的作用的假设——使我们能够直接将自组织谐波模式与注意力处理联系起来(主要是因为谐波模式与文献中与注意力处理相关的α和β EEG频率带之间的关系;参见例如Klimesch 2012),这些“元稳定同步的有效连接复合体”与精度优化之间的关系更为复杂。从功能上看,将自组织谐波模式视为类似于注意力模式似乎是合理的,因为它们“可能通过同步信号放大选择特定动态”(Safron 2020, 14)。然而,由于它们在形式上是以神经活动相空间描述的吸引子来定义的,很难看出它们如何能够被分解为上述神经系统的特定变量,包括精度,因为系统中变量的相互依赖性。因此,精度通常不是由自组织谐波模式显式建模的,这使得IWMT与其他FEP方法对注意力的理解不同。相反,精度优化是以分布式方式进行的,作为多个神经过程的副产品:包括“仿佛”的隐性注意力管理和明确的、有意识和无意识的直接“注意力转移”。这意味着对意识的访问不是由注意力偏差直接实现的,而是由更通用的过程实现的。这也与HOSS有些相似,Fleming(2020)强调精度优化不是负责意识的唯一机制。实际上,这种观点更符合当前关于注意力对意识作用的最新研究,强调区分不同类型的注意力处理的重要性(参见例如Pitts等人,2018)。

MM(马尔可夫一元论)在上述列表中是明显的缺席者,因为它对这些问题保持沉默,专注于为更详细的模型提供形式基础。

当然,还有其他只有两三个讨论中的提案共享的相似之处。它们的范围有限,不足以包含在上述的总体图景中;然而,重要的是要注意一些新兴的支持者,如时间深度(与复杂性相关),其重要性已在PGNW(Whyte和Smith 2021)和IWMT的最新发展中得到强调。

最后,重要的是要注意,如果一个人仅限于贝叶斯认知科学中的子集方法和框架独有的概念,总体图景可能会有显著不同。在最近的文章中,Vilas等人(2021)特别从主动推理框架中回顾了对各种意识现象的解释,并发展了一个与上述提出的图景显著不同的图景,这个图景严重依赖于生成模型的结构,特别是其时间和反事实深度。然而,正如作者准确指出的,一旦我们仅限于主动推理框架,出现的图景仍然是初步的,需要用机械和实施细节来扩展。

这个综述中讨论的账户的横截面为我们提供了一个所有贝叶斯认知科学理论可能一致的意识的总体图景。然而,我认为对这些相似之处进行更深刻的解读是有道理的。也就是说,假设的精度和复杂性的作用可以被视为意识的最小统一模型(MUM;在Wiese 2020的意义上)。


贝叶斯认知科学能否单独提供一个意识理论?

在转向对MUM(Minimal Unifying Model of consciousness)的讨论之前,需要指出一个重要的反对意见。在最近的一篇论文中,Marvan和Havlík(2021)分析了这里讨论的一些意识账户。他们的目标是论证PP本身并不提供一个意识理论,而是需要由已建立的意识理论提供的外部解释机制来实现这一点。鉴于这里提供的贝叶斯认知科学中意识账户的详细概述,他们的批评在某种程度上似乎是正确的。在这些理论中,也许只有WH、GE账户、DAM和MM没有明确引用“外部”于框架的某种意识理论,尽管最后一个账户不在Marvan和Havlík的兴趣范围内(原因已经在讨论中)。

Marvan和Havlík直接批评了WH方法的主要主张,指向与盲视(参见Dołe˛ga和Dewhurst 2020的批评)和连续闪光抑制范式(Tsuchiya和Koch 2005)的不兼容证据。通过这种方式,他们也拒绝了GE账户。然而,DAM没有被他们提及,似乎对他们的反对意见免疫。在这种情况下,意识访问是通过仅通过精确度权衡来实现的,这是贝叶斯认知科学的“专有”想法,并且可以提供连续闪光抑制的解释。用非常非正式的术语来说,可以指出,即使对一只眼睛的连续闪烁也会降低分配给来自视觉模态的所有信息的精确度。这是因为大脑开始将这些(不太可能的)感觉输入分类为嘈杂和不可靠的,通常两只眼睛的可靠性之间存在对应关系,导致对两只眼睛的不信任。结果,它丢弃了解释呈现给第二只眼睛的模式的正确假设。这种解释可以通过对视力较差的一只眼睛的参与者进行实验测试——在这种情况下,闪烁应该会导致明显较弱的抑制,因为大脑最有可能分别对每只眼睛的精确度进行建模。或者,连续闪光抑制的多模态版本中缺乏抑制可以为这一假设提供支持。

此外,一些引用其他意识理论的账户与“外部”账户建立了联系,但没有依赖于这些理论的解释工具,例如Fleming的HOSS和Whyte和Smith(2021年)对PGNW的最新解读。实际上,在这两种情况下,PP能够提供与意识相关的启动源的解释,而不是依赖于这个概念来解释意识访问。在HOSS中,如前所述,启动被认为与推断和当更高阶随机变量追踪意识接受“已看见”假设时出现的不对称预测误差相关。在PGNW中,当模型呈现刺激时,模型再现了启动现象。Whyte和Smith将他们模型中的启动与他们生成模型中的时间深层的证据累积和信念更新联系起来。通过这种方式,贝叶斯认知科学逃避了Marvan和Havlík的批评,但更能补充更多已建立的理论以机械细节。

最后,虽然通常将PP视为一个具有强大统一野心的认知理论,但这种观点实际上非常有争议。统一野心已被指出为失败(Litwin和Miłkowski 2020),并且在最近对FEP的更工具性理解的转变中(Colombo和Wright 2018;van Es 2020;Andrews 2021),也已建议PP并不作为一个“理论”持有,而应该被视为一个框架或工具箱(Litwin和Miłkowski 2020)。虽然这一点与PP本身的关系是有争议的,但在主动推断框架、FEP和贝叶斯认知科学的背景下,这一点的争议性要小得多。如果我们采取这样的观点,Marvan和Havlík的反对意见是正确的,但被误导了,因为贝叶斯认知科学从未需要单独提供意识理论。这种观点对于将精确度和复杂性解释为最小统一模型也是最慈善的,正如我将在下面论证的。


精确度和复杂性作为一个最小统一模型

Wiese(2020)提出了最小统一模型的概念,即“一个模型,

1. 只指定意识的必要属性(即它不涉及强烈的充分性主张),

2. 有可确定的描述,可以变得更具体,

3. 通过强调共同假设来整合现有的意识方法”(Wiese 2020,2)。

我认为精确度和复杂性可以被视为正是这样一个模型的元素,与Wiese讨论的信息生成账户相辅相成。Wiese的账户与这里提出的账户之间的关系如下:由于Wiese只主张MUM应该指定意识的必要属性,信息生成(Kanai等人,2019)可以很容易地通过下面讨论的方式被精确度和复杂性的概念补充(见“MUM条件”部分的末尾)。此外,这两个提议在很大程度上是逻辑独立的。如果经验证据使我们拒绝信息生成或精确度和复杂性对意识体验是不必要的,另一个元素仍然可以被视为MUM。

为了充实我的提议,我将展示精确度(优化)和复杂性(限制)对于访问和现象意识分别扮演的角色确实满足了Wiese设定的三个条件。在这样做的过程中,我将忽略文章前面讨论的特定观点的细节,专注于“贝叶斯认知科学”部分概述的贝叶斯意识方法的核心。关键是要展示在这一般贝叶斯方法下,这两个特征实际上是意识的必要条件。然后,我将分析精确度和复杂性是否可以被视为独立于它们作为一部分发展的贝叶斯认知科学的MUM,类似于Wiese将信息生成从Kanai及其同事的更大提议中分离出来。


最小统一模型(MUM)的条件

第一个条件指出,MUM应该由必要但不充分的特征组成。在这里,我将简要地反驳精确度和复杂性的充分性,并在下一节转向其必要性,因为这与贝叶斯认知科学和当前提议之间的联系密切相关。

尽管上述所有账户都为精确度和复杂性分配了强大的解释角色,但它们每个都对相关属性提供了进一步的规范和限制。这实际上是Marvan和Havlík(2021)提出的批评的主题。WH账户最接近于建立精确度优化作为意识访问的充分条件。然而,Parr等人(2019a)的模拟,以及Marchi和Hohwy(2020)的工作指出,虽然精确度负责管理当前意识体验的内容,但行动和主动推断进一步需要指定任何特定的感知。最强烈地,Fleming在他的HOSS中强调了精确度的不充分性,他明确指出精确度提供了解决歧义的输入,但并不决定意识。另一方面,复杂性与假设处理和生成模型更新强烈纠缠在一起,虽然它可以在概念上断开(如下所示),它只扮演其他过程的限制或参考点的角色,因此不能被视为意识的充分条件。

第二个条件非常明显地得到满足,因为“精确度”和“复杂性”在贝叶斯认知科学的正式主义中都是定义良好的术语。有多个竞争模型为这些过程提出了特定的神经或至少算法解释(例如,Spratling 2017)。独立于这个框架来看,它们仍然保留了它们强烈的数学定义,并且可以被适应到多种不同的意识理论中,正如贝叶斯认知科学与已建立的意识账户的不同联系所展示的。

最后,第三个条件指出,MUM应该允许建立现有意识账户之间的联系。我们至少可以在两个层面上考虑这个条件。

首先,如果我们接受贝叶斯认知科学是一个正确的认知理论的广泛假设,几个讨论中的账户(引用不同程度的证据来支持它们)声称FEP可以用来建立主导意识理论之间的桥梁。只需参考B-AST、PGNW和IWMT。此外,与全球神经工作空间或IIT等理论的联系正是基于精确度和复杂性的概念。

其次,如上所述,将精确度和复杂性理解为MUM是补充性的,而不是竞争性的,相对于Kanai等人(2019)的信息生成理论。Kanai等人(2019)的观点可以总结为意识的基本功能包括生成可能在时空上分离的事件的表示。在这个模型中,信息生成遵循感知的压缩-解压缩观点,由变分自编码器算法描述。为了描述它是哪种信息,作者采用了上述FEP意义上的生成模型的概念,Wiese将其与Ruffini(2017)提出的算法信息理论(或简单的Kolmogorov理论)联系起来,这有助于阐明压缩-解压缩观点,并引入了复杂性的概念到Wiese提出的MUM中。

重要的是要注意这是不同的复杂性概念,我们应该警惕将其与贝叶斯认知科学中使用的概念混淆。Ruffini(2017)和Wiese(2020)在Kolmogorov复杂性的技术意义上使用“复杂性”一词(见Cover和Thomas 2006)。这两个概念密切相关,因为它们都提供了信息丢失量(这些相似性的正式处理由Cerra和Datcu 2011提供)。此外,它们通常都是不可计算的,并且可以用数据压缩来近似。最重要的区别是“相对熵”(在自由能方程中看到的Kullback-Leibler散度)是在经典信息理论的概率框架内指定的,并且共享其无法“描述孤立对象的信息内容”(Cerra和Datcu 2011,903)。另一方面,Kolmogorov复杂性是在算法信息理论中定义的,它将孤立对象的信息内容概念作为主要概念(Cerra和Datcu 2011,903)。Cerra和Datcu展示了在算法信息理论中可以构建相对熵的概念的平行概念,基于Kolmogorov复杂性定义,即“当使用这样的表示[x]而不是其最紧凑的一个(其长度等于其Kolmogorov复杂性)时,失去的压缩能力”(903)。

尽管背景不同,复杂性的两种概念都扮演着相似的角色。对于Ruffini(2017)来说,“结构化意识与那些在描述和与外部世界(信息)互动方面高效的信息处理系统相关联”,这里的效率被描述为给定内部模型时输入数据的低(Kolmogorov)复杂性。在贝叶斯认知科学中,复杂性同样被用来解释生成模型的“效率”。因此,尽管使用了不同的正式定义,将复杂性视为MUM与信息生成理论是兼容的。此外,将精确度优化纳入这一账户将是直接的,如下所示。


精确度和复杂性(优化)作为意识的必要属性

是否将精确度和复杂性优化视为意识系统的必要属性,这在一定程度上取决于我们是否接受贝叶斯认知科学对认知的解释。如果一个人同意这一理论提供了一个足够充分的模型来描述认知系统,那么这个问题的答案就很明显了,因为这些是贝叶斯认知科学中的中心术语,尤其是在其对意识体验的描述中更是如此。然而,一旦我们考虑一个更广泛的画面,情况就并非如此。尽管Wiese(2020)认为所有意识理论都必须包含信息生成的组成部分,这一主张似乎是无可争议的,但对于精确度和复杂性来说,情况并非如此。例如,这是一个经验问题,一个理论是否能够提出内部模型的复杂性[在非常一般的意义上,类似于Kanai等人(2019)和Ruffini(2017)所要求的]被设定为一个恒定值,或者认知系统无法估计和管理输入的精确度,是否能够解释意识(后者可能是IWMT的情况,如上所述)。然而,同时,精确度和复杂性优化的假设并不局限于对完整的贝叶斯认知科学故事的接受,它们可以补充其他账户。特别是如果我们接受这些观点构成一个框架而不是一个统一的心理理论(参见Litwin和Miłkowski 2020)。

再次考虑信息生成理论(Kanai等人,2019)和精确度优化。在构建他们的理论时,Kanai和同事们特别旨在解决与全球广播相关的意识方面[与元认知相对,由Dehaene等人(2017)提出的区别]。他们认为,支撑与全球广播相关的功能的是“使用内部感觉运动模型生成虚构表示的能力”(Kanai等人,2019,3)。他们的账户遗漏了什么,以及我们得出它是意识体验的必要但不充分条件的另一个原因是,如何使这些生成的信息在大脑中变得可用。Kanai和合作者简单地声明这些信息被保存在短期记忆中,将全球工作空间理论的核心问题置于他们兴趣的范围之外。然而,由于信息生成可以在预测编码方案中实现,因此直接使用PP的工具来解释短期记忆中的精确度(或权重)分配给感知与生成的信息是直接的。

我们已经看到,精确度和复杂性如何与全球神经工作空间理论和IIT(信息整合理论)相关联。因此,本文的主张可以有两种解读方式。

首先,以一种相对无争议但有限的方式:精确度和复杂性构成了贝叶斯认知意识的最小统一模型(MUM)。正如Wiese所描述的,将贝叶斯意识理论的共同元素用最小统一模型的术语来表述,有助于将它们与现有的意识理论统一起来——在这种情况下,也包括先前提出的最小统一模型。通过这种方式,精确度和复杂性的优化成为了未来寻求测试贝叶斯意识理论的实验的关键要素。正如Whyte和Smith(2021)以及Parr等人(2019a)的研究已经引领的那样,这些实验应该寻求在意识研究中使用的标准范式内复制行为和成像研究的结果。初步实验应特别关注精确度和复杂性的作用,以验证广泛的贝叶斯方法。这可以通过例如重复Fleming(2020)的研究,但明确建模精确度估计,而不是像Fleming那样假设固定的噪声来实现。

其次,以一种更广泛但相当有争议的方式:精确度和复杂性构成了一般意识的最小统一模型(MUM)。贝叶斯意识方法与更经典的账户之间的密切关系表明,一旦我们接受将贝叶斯认知科学解释为一个框架或工具箱,就有一大群理论可以通过精确度和复杂性来扩展。实际上,精确度分配可以包含在几乎所有基于信息处理的意识账户中,这包括方差、熵或扮演类似角色的另一个术语——即几乎所有现有的账户。复杂性提出了额外的限制,因为它要求账户假设一个内部模型,但只是在非常广泛的意义上——同样,这也是大量现有账户所满足的。然而,这种解释可能会削弱这两个术语的技术含义,从而限制它们能够做的解释工作量。此外,将精确度和复杂性添加到现有理论中可能具有事后、重解释和冗余的特征。然而,正如本文所展示的,有一些实例中这两个概念可以为更经典的账户提供新的、可测试的意识现象和属性的解释。一个这样合理的例子来自于HOSS和PGNW提供的全局启动的解释。两者都提出了一个合理的机制,通常在全球神经工作空间理论中被忽略,而且都可以在贝叶斯认知科学之外的方式中得到经验验证,如前一节所描述的。如果这个研究计划能够成功,它将进一步确保贝叶斯认知科学作为一个有用的工具箱,用于解释认知背后的机制。



https://academic.oup.com/nc/article/2021/2/niab038/6395174?login=false

CreateAMind
ALLinCreateAMind.AGI.top , 前沿AGI技术探索,论文跟进,复现验证,落地实验。 鼓励新思想的探讨及验证等。 探索比大模型更优的智能模型。
 最新文章