GWT意识模型的工程实现，从访问意识到灵活行为

科技 2024-11-22 20:51 上海

Flexible serial processing in networks of spiking neurons From access consciousness to flexible behaviour 2020

灵活的串行处理尖峰神经元网络从访问意识到灵活行为https://theses.ubn.ru.nl/handle/123456789/10626

第一个解释联盟形成的神经模型，链式心理操作的模型

摘要

在不同大脑区域之间灵活地传递信息的能力对于执行新指令的任务至关重要，其中每一步都以前一步的结果作为输入。大脑如何在并行基质中实现这一点尚不清楚。心理学研究表明，意识在其中扮演着关键角色，因为当输入刺激是潜意识时，可以执行单个步骤，但无法执行多个步骤。这与全球神经元工作空间理论一致，该理论认为，当信息获得进入广泛的额顶网络的权限时，就会被有意识地感知，并且可以广播到大脑中几乎所有的处理单元。

在这个项目中，我提出了第一个基于这一理论的尖峰神经模型，用于执行由多个步骤组成的序列任务。神经工程框架和语义指针架构被用来构建模型，包括并行处理网络、全局工作空间、工作记忆组件和门控网络。得到的神经网络在认知和生物学层面上都与全球神经元工作空间理论一致，因为它解释了意识竞争、与之相关的由P3波标记的点火以及选择性广播。有趣的是，它还解决了在形成意识访问联盟过程中的历时和共时整合的未解决问题。模拟表明，该模型能够以稳健的方式执行许多步骤。最重要的是，它复现了人类的反应时间模式。因此，该模型为解释意识在序列处理中的作用提供了一个很好的框架。

第1章引言

1.1 目标

在过去三十年中，我们在理解意识及其神经基础方面取得了巨大进展。专家们认为最有前途的理论已经出现：全球工作空间理论（Michel等人，2018）。然而，以下问题尚未得到解决：“具有全球工作空间架构的神经模型如何执行多步骤任务，并解释人类在这些任务中的行为？”因此，这是我将在这里解决的问题。

1.2 组织结构

在背景（第2章）中，我描述了对意识和人类序列处理的研究。在第3章中，我解释了创建和优化模型的方法，该模型在第4章中进行了描述。模型的行为在结果（第5章）中进行了描述，并在第6章中进行了讨论。

第2章背景

2.1 意识

2.1.1 历史背景

意识在认知科学中曾长期被视为一个禁忌词汇，即使在行为主义逐渐衰落、不再严格禁止提及心理状态时也是如此（Seth，2018）。这一点可以通过以下引文来说明：“也许我们应该禁止使用这个词十年或二十年”（Miller，1962年，第40页），或者“意识是一个迷人但难以捉摸的现象。无法具体说明它是什么，它做了什么，或者它为何进化。关于它的值得一读的东西还没有写出来”（Sutherland，1989年，第95页）。

在由数十亿神经元组成的神经系统中识别意识的神经基础是一个严峻的挑战，而许多混杂因素的存在使得这一挑战更加艰巨。例如，中断大脑的血流会导致意识丧失，但这并不意味着应该将血流视为意识的基础。目标是隔离使意识体验成为可能的必要和充分条件。因此，寻找任何单一意识感知共同充分的最小神经元机制，即所谓的意识的神经相关物（NCC），一直是研究的目标。这一领域由Francis Crick和Christof Koch开创，他们的开创性论文《朝向意识的神经生物学理论》重新激发了对意识研究的兴趣（Crick & Koch，1990）。

几年后，Bernard Baars在解释意识访问方面取得了实质性进展，意识访问是指信息被选择并在大脑中全局可访问以供进一步处理和报告的现象。在《意识的认知理论》（Baars，1993年，第15页）中，他基于受试者通过行为报告其体验内容的能力，给出了（访问）意识的以下操作性定义：

目前，我们将认为人们意识到某个事件，如果（1）他们能够立即之后说他们意识到了它，并且（2）我们可以独立验证他们报告的准确性。如果人们告诉我们，当我们向他们展示香蕉时他们体验到了香蕉，而不是苹果，我们就满意地假设他们确实意识到了香蕉。

访问意识的概念后来引发了“为什么全局可访问性会引起意识体验？”的问题，构成了心灵哲学中的难题（Chalmers，1995年，第8页）。相反，现象意识指的是意识的体验方面，但由于缺乏合适的方法来研究它，它在很大程度上未被神经科学所涉及。然而，我在这里使用的建模方法已被证明对于给出现象学属性的初步神经解释是有用的（Thagard & Stewart，2014）。由于现象意识不在此工作的范围之内，因此对意识一词的进一步使用将指的是访问意识的概念。

2.1.2 最小对比范式

为了找到意识的神经相关物（NCCs），允许实验者用最小差异的刺激操纵意识的范式是非常有帮助的。由于引起的变化最小，可以在有意识感知的条件下比较神经活动与无意识条件下的活动。已经开发了许多这样的最小对比范式（Kim & Blake, 2005; Baars, 1993）。在后向掩蔽中，当视觉刺激与第二个干扰刺激（称为掩蔽）的呈现时间间隔太短时，视觉刺激不会被有意识地看到（见图2.1）。

与Bernard Baars提出依赖于参与者报告的操作性定义一起，最小对比范式提供了一种科学研究意识的方法。这种方法催生了意识最重要认知和神经理论之一，如下一部分所述。

2.1.3 全局工作空间理论

全局工作空间理论由Baars（1993）引入，试图解释人类认知的组织，并描述信息被有意识体验的必要和充分条件。它建立在关于心智模块化架构的早期想法之上（Fodor, 1983），同时引入了无意识处理器与打破无意识处理模块性的有意识全局工作空间之间的区别（见图2.2）。

处理器是由多个过程组成的系统，涉及心理表征的快速和习惯性转换，通常通过经验获得。这种处理的一个重要特征是信息封装，换句话说，过程中包含的信息仅在局部可访问。当一组过程共同工作以执行特定领域的功能，如理解句子的含义或驾驶汽车时，它们被定义为处理器。因此，它们构成了语义和程序记忆的基础。

虽然由于封装，处理器中包含的信息是无意识的（Shanahan & Baars, 2005），但全局工作空间通过使所有处理器都能访问信息，包括那些通过行为报告体验的处理器，从而使信息变得有意识。这个表征空间因此使得系统范围内的通信成为可能。然而，其容量有限，一次只能允许某些信息访问，这解释了有意识体验的序列性质。为了进入工作空间并变得全局可用，某些信息必须通过竞争过程被选择。Dehaene等人（2006）提出了一个分类系统来描述刺激可能被有意识感知或不被感知的不同条件（见图2.3）。当刺激太弱时，其处理被限制在层次结构的低层，并且无论注意力的焦点如何，都不会竞争有意识的访问。它被称为阈下知觉。或者，当它足够强以访问更高层次但因为未被注意而未能进入意识时，刺激被称为前意识。然而，一旦注意力的焦点转移，如果其激活得以维持，它可能会被选择。只有当刺激既足够强以进入竞争，又成为注意力的焦点时，刺激才被允许进入工作空间。然后主体有意识地感知刺激，并能够将其用于进一步的处理或报告。

在该理论的几种表述中，处理器可以合作并形成一个“联盟”，将信息带入有意识的工作空间（例如Baars等人，2013年；Shanahan，2012年；Baars & Franklin，2009年；Baars，1993年）。这个概念也与其他意识理论共享（例如Crick & Koch，2003年）。由于信息是封装的，每个处理器可以代表某个感知的一些特征，而不知道与该感知相关的信息正在其他处理器中被代表。联盟的概念意味着全局工作空间能够将这些独立的信息片段视为属于同一感知，而不仅仅是选择它们中的一个。理解大脑如何实现这一点需要解决“绑定问题”，即如何将多种多样的表征整合成单一统一的感知。由于工作空间接收来自不同时间窗口（过去、现在和未来；见图2.2）的系统的信息，整合既是共时的（在某一时刻）也是历时的（随时间变化；Mashour等人，2020年）。

在下一部分中，我将描述全局工作空间理论的神经基础。我还将讨论其初步的神经模型以及它们为何未能提供对序列处理和联盟的令人满意的解释。

2.1.4 神经实现

在过去二十年中，全局工作空间理论受到了彻底的调查。特别是，研究的焦点放在确定它是否准确地描述了人类意识背后的神经架构。许多研究发现了与全局工作空间组织一致的神经相关物，从而形成了全局神经元工作空间理论（Mashour等人，2020年；Dehaene，2014年；Dehaene等人，2014年；Dehaene & Changeux，2011年；Dehaene & Naccache，2001年）。在《意识与大脑》（Dehaene，2014年）一书中，描述了以下意识的神经特征（见图2.4）：

1. 包括顶叶和前额叶回路在内的许多区域的活动大大增强。

2. 在看到的刺激呈现后大约300毫秒，头皮记录到一个晚期正波“点燃”（P300或P3波）。当刺激保持无意识时，这个波不存在。

3. 从看到的刺激呈现后大约300毫秒开始，伽马振荡的功率增加。

4. 遥远的大脑区域同步。

正如图2.4所示，已有研究表明在有意识的条件下，beta波功率会增加（Gross等人，2004年）。然而，其他研究报道了相反的结果（Gaillard等人，2009年；Wyart & Tallon-Baudry，2009年）。关于gamma带功率增加的结果更加一致，因此构成了意识访问更可靠的标志（综述见Dehaene & Changeux，2011年）。这些神经特征为全局神经元工作空间理论奠定了基础。工作空间被假设由主要位于前额叶和顶叶皮层的分布式神经元集合组成，并通过长程兴奋性轴突相互连接。这些轴突起源于第2层和第3层的锥体细胞，并投射到兴奋性或抑制性神经元上（Dehaene等人，1998年）。与感觉皮层的局部连接相比，背外侧前额叶和下顶叶皮层的第2层和第3层更厚（见图2.5）。这些众多的相互连接确保了在任何时候只有对应单一意识表征的神经元子集是活跃的，而其他神经元则被抑制。

进入这个计算空间的指标是P3波和gamma振荡。正如Dehaene（2014年，第180页）所写，正波可以通过工作空间细胞的特性来解释：

现在，细胞的几何布局是这样的，在活跃的细胞中，突触电流从表层树突流向细胞体。因为所有这些神经元彼此平行，它们的电流叠加在一起，在头部表面，它们在编码有意识刺激的区域产生一个慢速的负波。然而，被抑制的神经元主导了这一景象，它们的活动叠加在一起形成了一个正电位。由于被抑制的神经元比被激活的神经元多得多，所有这些正电压最终在头部形成了一个大波，即我们每次意识访问发生时都能轻易检测到的P3波。

当获胜联盟从一个处理器发送并广播到其他处理器时，多个区域的活动会同步。

2.1.5 全局神经元工作空间模拟

已经提出了许多该理论的计算模型。由于全面的综述超出了我的工作范围，我简要描述那些基于尖峰神经元的模型。

Dehaene等人（2003年）提出了一个与解剖学和生理学数据一致的神经模型，该模型由连接到丘脑网络的3层皮层柱组成。这个模型展示了类似P3的点火、gamma振荡和远距离同步。此外，模型展示的全有或全无动态解释了注意力瞬脱范式中的主观报告。后来，模型的扩展被用来模拟工作空间的随机自发活动以及它如何解释不注意盲（Dehaene & Changeux, 2005）。另一个研究团队提出了一个模型，解释了全局工作空间竞争和广播（Shanahan, 2008）。有趣的是，它被证明即使在随机连接的情况下也展现出相同的行为（Connor & Shanahan, 2010）。最后，Zylberberg等人（2010）开发的一个模型惊人地再现了心理不应期和注意力瞬脱。尽管论文没有明确提及全局工作空间理论，但该模型由感觉和运动模态组成，它们竞争访问一个中央路由瓶颈，这个瓶颈展示了全有或全无的动态。然而，它无法解释人类序列处理的丰富性。实际上，它只能通过执行单一的路由命令来执行两个竞争任务（信息从一个区域发送到另一个区域）。为了执行每一步的结果用作下一步输入的多步骤任务，路由机制必须更加灵活。此外，该模型的扩展性不佳，因为每种感觉模态的每个符号都投射到路由器中的一个选择性群体。因此，它无法解释多个处理器是如何集成的，在这一点上与全局神经元工作空间有很大的不同。

据我所知，正如Shanahan（2012年）所指出的，没有一个提出的神经模型解决了联盟形成过程。这是因为在这些实验中，神经活动与认知表征之间没有画出精细的联系。在这种情况下，无法解决绑定问题。此外，尽管全局工作空间理论被认为支持灵活的序列处理（Mashour等人，2020年；Zylberberg等人，2011年），但这些模型无法执行由多个步骤组成的认知任务（但见Fountas等人，2011年）。

2.2 灵活的序列处理

“大脑是计算机”的类比在现代认知科学中并不流行，因为神经元是并行工作，并不像是计算机那样同步在一个中央时钟上。然而，这些不同的细胞不知何故产生了序列行为，例如“在计算一个实数的过程中”（图灵，1936年，第231页）。大脑是如何做到这一点的仍然不是很清楚。

当然，单个处理器可以学会执行一系列操作。然而，要执行新的多步骤任务，就需要灵活地路由信息，从而打破处理器组织模块化的能力。尽管计算心智的观点被认为已经过时，但艾伦·图灵的通用计算机，现代串行计算机的祖先，是受到人类认知的启发，实际上可能与意识处理功能相似（Zylberberg等人，2011年）。这一点最好由Sackur & Dehaene（2009年）的研究来证明，其中参与者被展示了一个数字，并被要求执行不同的数学任务（见图2.6）。这个数字是一个自然整数N ∈ {2, 4, 6, 8}。在简单任务中，参与者被要求报告刺激N是小于还是大于固定参考值5。在另外两个任务中，参与者被要求先对N执行一个算术操作，然后将该操作的结果与5进行比较。在链式加法任务中，首先要执行的操作是修改后的加法N ⊕ 2，而在链式减法任务中，操作是修改后的减法N - 2。这些操作与它们的普通对应物+和-不同，因为引入了一个循环规则，如图2.6所示。这个规则的好处是操作的结果保持在输入刺激集{2, 4, 6, 8}之内。因此，操作⊕和-可以定义如下：

2.2.1 实验1：时间测量探索

第一个实验的目标是确定参与者在执行复合任务（N ⊕ 2 ≶ 5? 和 N ÷ 2 ≶ 5?）时是否会比执行简单任务（N ≶ 5?）花费更多时间，以及操作链是否以最优的串行方式执行。为了执行其中一个复合任务，一个理想的串行计算机首先会执行算术运算，等待该运算完成，然后才使用第一个运算的结果执行比较运算。图2.7中的模型1就是这样一台机器的描述。

这个实验的结果在图2.8中显示。在简单试验中观察到距离效应，即输入刺激与参考数字五之间的距离越大，比较操作进行得越快，错误也越少。这种效应在心理学中是众所周知的（例如 Moyer & Bayer, 1976）。结果还表明，参与者在链式试验中回答问题的时间比简单试验多花了85毫秒，并且错误率也高出了4.3%。此外，还有明显的区别存在于一致性试验（即输入刺激和算术运算的结果都落在五的同一侧，例如N = 2, N ⊕ 2 ≶ 5?）和不一致性试验（即不是这种情况，例如N = 4, N ⊕ 2 ≶ 5?）之间。不一致性条件下的反应时间和错误率更高。

简单串行模型预测，在链式试验中应该存在与算术运算的图像相关的距离效应。然而，在统计分析中没有发现这样的效应。反应时间或错误率与五和输入刺激之间的距离之间也没有显著的交互作用。这与观察到的不可预测的一致性效应一起，是反对简单串行模型的证据。实际上，这些结果表明输入刺激的信息被用于比较操作中，这导致不一致性试验中的错误更多和反应时间更慢，并且可能补偿了图像距离效应。

Sackur和Dehaene（2009年）提出了两个具有输入到比较的串扰的替代模型（见图2.7）。与简单串行模型一样，模型2顺序执行操作，但将算术操作的图像和输入刺激都作为比较操作的输入。另一个替代模型只是部分串行。当输入数字呈现时，两个操作并行执行，算术操作的结果被传递到比较操作中。

由于两个模型都能解释这个实验的结果，Sackur和Dehaene（2009年）进行了其他实验，以调查操作的时间进程并区分这两个模型。

2.2.2 实验 3：启动效应实验

第二个实验的结果支持模型3，但不如实验3的结果那么清晰，所以我这里不讨论它们。启动实验的设计与上述描述的程序略有不同（见图2.9）。首先呈现一个数字作为启动刺激，然后呈现一个目标数字，要求与数字五进行比较，启动刺激和目标数字之间的刺激发生异步（SOA）是可变的。参与者被要求使用启动刺激来更快地回答问题，在66%的试验中，目标数字将分别是T = P ⊕ 2（链式加法）、T = P ÷ 2（链式减法）或T = P（简单任务）。并未告知参与者有66%的信息性启动刺激。

如果模型2是这个实验的基础，那么应该观察到与SOA无关的一致性效应，因为比较处理器的输入应该是计算出的图像、目标和启动刺激的混合。模型3对这次实验的结果有不同的预测。在短SOA时，应该观察到第一个自动的启动-目标一致性效应，反映了使用启动刺激开始比较操作。随后，由于执行算术运算并将其结果传递给比较器，应该观察到战略性的图像-目标一致性效应。这两个依赖于SOA的启动效应被观察到，为反对模型2提供了强有力的证据（见图2.10）。因此，这项研究表明，人类在执行串行任务时存在部分并行处理的干扰。由于一旦执行算术运算就需要认知控制来传递信息，最后一个实验调查了这种认知架构与意识的关系。

2.2.3 实验4：反向掩蔽

最后一个实验使用了反向掩蔽，即第2.1.2节中描述的最小对比度范式。引入了两个额外的任务（见图2.11）。命名任务是识别并报告输入刺激。算术任务是报告N ⊕ 2或N ÷ 2。其他任务与之前实验中的任务相同。

图2.11显示了所有任务类型中参与者的表现，作为刺激可见度的函数。即使当刺激没有被有意识地感知时，参与者在命名、算术和简单任务中的表现也显著好于偶然水平。然而，他们在复合任务中的表现则是偶然水平。

这项研究表明，执行新的多步骤任务所需的串行处理并不是人脑的自然操作模式，这一点也得到了更近期报告的证实（Fan et al., 2012b,a）。实际上，应该在后期阶段执行的步骤与执行第一步操作同时开始并行处理输入刺激。需要有意识感知启用的努力和高级别认知控制来负责顺序处理和信息流。此外，在执行链式任务时，观察到左颞叶、左顶叶和左枕叶区域持续活动（Fan et al., 2012a）。正如Sackur & Dehaene (2009)所指出的，全局工作空间理论归因于意识的功能是这项研究中由有意识感知启用的操作模式所需的功能。有了全局工作空间架构，多步骤任务可以按以下方式执行：(1) 刺激进入工作空间，(2) 然后被发送到负责执行第一个操作的处理单元，(3) 结果进入工作空间，(4) 然后被发送到另一个处理单元执行下一步，以此类推。第一个实验中的一致性效应和掩蔽实验中单步任务略高于偶然水平的表现可以通过至少一些参与任务的处理单元之间的部分通信来解释。因此，全局工作空间架构理论上可以解释Sackur & Dehaene (2009)的结果。

这篇论文的目标是构建一个与全局工作空间理论和模型3兼容的尖峰神经模型，以评估它是否能够（1）执行多步骤任务和（2）复现实验1的结果。由于实验2、3和4旨在调查执行第一个实验背后的认知架构，因此用一个结构上与这些实验结果兼容的模型来复现第一个实验被认为是令人满意的。当然，复现其他实验也很重要，以便全面测试模型，但这将留给未来的研究。

第三章方法

我在创建和模拟神经模型时使用的软件Nengo（Bekolay et al., 2014）中实现的框架提供了一种创建能够执行高级认知任务的尖峰神经模型的方法。在本章中，我描述了这些框架以及一种优化它们参数的方法。

3.1 神经工程框架

下面介绍的神经工程框架（NEF）的三个原则由Eliasmith & Anderson（2003）提出。它们提供了一种在尖峰神经元网络中实现以动态系统和向量运算格式指定的认知模型的方法。如第3.2节所述，NEF还与一种称为语义指针的特定类型的向量一起使用，以表示和操纵语义信息。

3.1.1 表示

NEF的第一个原则假设，称为“集合”的一组神经元表示一个D维实数向量x。集合中的每个神经元i都有一个增益参数αi、一个偏置电流bi和一个由神经模型定义的非线性G。在这项工作中，所有神经元都是泄漏积分发放（LIF），因为这种神经模型在生物学合理性、可解释性和计算成本之间提供了良好的折衷。因此，G将神经元的内部电流转换为神经脉冲列。将被表示的向量x与神经元i的活动映射起来的关键元素是编码向量ei，它对应于使神经元最快发放的方向。脉冲列ai的计算如下：

方程3.2描述了如何从脉冲列中解码回x的近似值。首先，神经活动与一个指数衰减的突触滤波器进行卷积，其中τ是时间常数，然后将结果乘以一个解码向量di。

为了找到线性解码器di，随机采样x值（称为评估点），并通过正则化最小二乘优化最小化重构误差E。

3.1.2 计算

第二个原则描述了如何连接神经元以实现所需的转换。权重矩阵被定义为编码器和解码器的外积。然后，方程3.1可以用加权的突触后电位求和来重写。

通过在方程3.3中将x和替换为，可以求解连接的解码器以实现任意转换：

3.1.3 动态

为了考虑各种神经系统，神经编码理论还必须解释反馈连接的作用。使用计算原则，神经群体可以连接回自身。当引入这种递归连接时，可以实施以下形式的状态方程：

其中x(t)是状态向量，u(t)是输入，y(t)是输出。系统行为由动态矩阵A、输入矩阵B、输出矩阵C和直通矩阵D决定。回想一下，时间常数τ的突触滤波器hτ(t)驱动神经元动态。因此，状态方程是通过以下方式实现的：

其中是利用拉普拉斯变换（Eliasmith & Anderson, 2003）得到的。非线性动态也可以使用计算原则来实现。

3.2 语义指针架构

语义指针架构（Semantic Pointer Architecture，SPA）是一种认知架构，它利用了矢量符号架构（VSA HDC）的概念，这是一系列已被证明对模拟高级认知有用的方法（Eliasmith, 2013; Eliasmith et al., 2012; Gayler, 2004）。更准确地说，SPA部分地在尖峰神经元中实现了全息简化表示（Holographic Reduced Representations，HRR）（Plate, 1995），使用的是NEF。方法如下：一个符号（或概念），称为语义指针，用粗体大写字母表示，被定义为高维空间中的一个单位向量。使用四种操作来操纵和组合语义指针以形成新的语义指针：

1. 缩放：标量乘法A = cB得到一个与B方向相同的向量，其大小按c因子缩放。

2. 比较：点积A · B计算语义指针A和B的向量在向量空间中的接近程度。这提供了语义相似性的度量。

3. 超位置：指针向量的加法A = B + C得到一个与B和C都相似的语义指针A对应的向量。

4. 绑定：两个指针的绑定A = B ~ C得到一个与B和C都不相似的指针A。~表示圆周卷积。要从绑定结果A中检索一个指针，可以使用圆周卷积和其中一个原始指针的近似卷积逆。例如，，其中是C的近似逆。

请注意，所有操作都保持了向量的维度（D）。SPA还利用皮层-基底节-丘脑皮层回路进行认知控制。基底节被认为实现了胜者为王的计算，换句话说，就是选择输入效用最高的动作（Redgrave et al., 1999）。Gurney et al. (2001) 提出的模型使用NEF在尖峰神经元中实现（图3.1；Stewart et al., 2010b）。结合丘脑和皮层组分，它作为一个产生系统工作（Stewart et al., 2010a）。因此，它可以识别皮层模式，并随之将信息发送到皮层群体或将信息从一个皮层群体路由到另一个皮层群体。图3.2显示了以下玩具规则的实现：

3.3 参数优化

为了使下一章描述的模型适应人类行为，需要最小化一个评估函数，以确定某些参数。函数的选择至关重要，取决于项目的范围。在Sackur & Dehaene (2009)中，使用了中位数正确的反应时间和错误率。我们可以分别用RT和ER来表示它们。这些指标必须根据实验条件（以及模型中的参数）进行索引。此外，引入了下标h和m来区分人类和模型的行为。因此，是模型使用参数θ回答任务t和输入N的试验所采取的中位数正确反应时间。

参数θs是未建模的感觉运动处理的延迟。由于θs可以简单地加到中位数反应时间上，因此当只有这个延迟变化时，不需要多次模拟模型。均方根误差不是合适的指标，因为它会惩罚与经验均值的偏差，尽管人类数据存在变化。相反，适应度误差函数定义如下：

对于每个参数化θ，模拟10名参与者两次执行所有实验条件（随机顺序）。由于评估L计算成本较高，贝叶斯优化是最小化它的一个好方法。该函数使用具有Matérn核的高斯过程进行近似，该核假设函数值遵循多变量高斯分布。这个过程是使用scikit-optimize（Head et al., 2018）实现的。一旦使用参数θ运行了模拟，就很容易计算具有变量θs的L。因此，在贝叶斯优化算法的每次函数评估中，针对延迟θs最小化该函数。这是使用SciPy（Virtanen et al., 2020）中实现的有界-限记忆Broyden-Fletcher-Goldfarb-Shanno算法（Byrd et al., 1995）完成的。

第4章 模型

在这一章中，我描述了链式心理操作的模型。尽管图4.1.A中描绘的处理单元专门设计用于执行Sackur & Dehaene (2009)的任务，但总体架构遵循全局神经元工作空间理论，并且可以用来在几乎任何处理单元之间链式传递信息（见图4.1.B）。有三个处理单元执行数学运算：比较、加法和减法。路由器组件通过乘积网络控制信息流，这些网络对全局工作空间的输入和输出进行加权。

4.1 处理单元

如第2.1.3节所定义，处理单元与长期语义和程序性记忆相关联。它们可以由几乎任何一组过程组成。因此，处理单元是任何已经学习（或遗传）执行特定领域转换并与全局工作空间通信的神经网络。为了模拟Sackur & Dehaene (2009)描述的任务，使用了三种类型的处理单元。我将在下面描述它们。

4.1.1 感觉和运动

当一个处理单元直接接收感觉输入时，它被称为感知处理单元，当它直接参与运动的准备或执行时，被称为运动处理单元。为了简单起见，并且因为视觉处理和运动控制的精确建模不是当前工作的重点，视觉和运动处理单元不需要执行任何计算。在这里，视觉处理单元接收输入并输出与任务输入相对应的语义指针。行为反应直接从运动处理单元从工作空间接收的内容中解码得出。

4.1.2 异构联想记忆

第二种类型的处理单元使用异构联想记忆，它将值与键关联起来。它可以通过网络深度为一层的网络实现，该网络通过突触连接转换其输入（见图4.2）。在这一层中，属于第i个处理单元的神经集合pij负责识别语义指针Kj ∈ K。K是处理单元需要识别的键集。pi是处理单元i的输入（在语义指针空间中）。动态由以下方程给出，这是由动态原则规定的：

在反馈权重为0.7的情况下，信息以与无意识处理相一致的方式衰减。为了强制执行约束pj ≥ 0，选择编码器的方式是神经元只对正输入做出响应。从现在开始，任何强制执行此类约束的网络都适用同样的规则。集合的标量输出乘以语义指针，其中Vj ∈ V是与键Kj相关联的值指针，ON指示处理器中向第4.4节描述的路由器的前意识信息量。

加法和减法处理器分别将结果N ⊕ 2和N ÷ 2（与ON叠加）的语义指针与输入N的语义指针关联起来。这可能是对生物大脑中发生情况的简化。实际上，大脑不太可能为每个数字使用一个网络来执行加法或减法。然而，行为研究中没有任何迹象表明需要更复杂的网络来复制人类的表现。此外，Stewart等人（2017）已经证明单层网络可以比较任何两个数字，相同的方法可以用于执行算术运算。实际上，我使用他们的方法来模拟第三种类型的处理器。

4.1.3 累积至阈值

比较处理单元是一个累积至阈值处理单元（见图4.3）。这种机制是为了复现第2.2节中描述的距离效应和一致性效应。一个组合的神经集合代表了要比较的两个数字对应的语义指针的连接（因此它代表2D维向量）。如果第一个数字大于第二个数字，群体输出1；如果相反，则输出-1；如果它们相等，则输出0。这个功能是使用NEF的计算原则，并通过随机选择对应于数字语义指针的向量作为方程3.5的评估点来实现的。比较的结果，记为ci，被输入到具有以下动态的积分器pi c中：

时间常数τc决定了积分的速率，并且将被优化以适应人类反应时间。在每次试验开始时，通过向其神经元发送负电流手动重置积分器。固定参考数字五对应的语义指针，记为D5，作为第二个输入给出。由于正值表示第一个数字大于五，负值表示相反，因此积分器的输出乘以MORE - LESS指针。然后，它被发送到与上述描述相似的联想记忆中，但有一些不同。首先，MORE和LESS指针与它们自己加上ON关联。因此，记忆可以被认为是自联想的。其次，集合接收到抑制性输入θth。然后，集合的输出与θth相加以补偿抑制。因为如前所述，集合被调整为只对正值做出响应，所以θth作为阈值。

4.2 全局工作空间

在全局工作空间理论中，对访问权的竞争必须满足以下条件：

1. 同一时间内只能有一个联盟在工作空间中活跃；

2. 在没有外部输入的情况下，活跃的联盟得以维持，以确保意识内容的连续流动；

3. 获胜联盟的动态对应于非线性点火；

4. 为了使联盟能够访问工作空间，其激活必须高于一个阈值；

5. 处理单元可以通过集体提出表示，或者多个不竞争的表示来形成一个联盟。

在这里，我展示了胜者为王网络（WTA），特别是神经实现的修改版泄漏竞争累积器模型（LCA）（Usher & McClelland, 2001），满足这些标准。WTA网络的功能是在一组候选选择中选择激活度最高的候选，并抑制其他选择。

让集合gj代表第j个候选表示Rj ∈ R的激活度，R包含所有可以在工作空间中被有意识表示的表示。LCA的动态则由以下方程给出：

图5.1中显示的网络被读取为。因此，输出收敛为获胜的语义指针乘以一，并且无论输入gj如何都得以维持。这些动态对应于全局神经元工作空间理论中描述的非线性点火和维持激活。使用海维赛德函数，这也类似于Gosmann等人（2017）的独立累积器模型（IA），只是没有引入额外的层。请注意，候选Ri必须满足才能成为Rj的后继者。因此，反馈权重Θ构成了Ri的阈值。对于更大的联盟，需要超过的值更大，因为更多的表示将Θ送回它们自己。

4.3 处理单元与工作空间的交互

读者现在应该更清楚地理解专家处理单元和竞争性工作空间如何在尖峰神经元中实现。然而，它们如何相互作用的问题仍需解答。特别是，处理单元不应平等地对竞争做出贡献，而应根据上下文依赖的注意力来加权它们的贡献。同样，虽然工作空间中选择的信息对所有处理单元都是可用的，但它应该只被相关处理单元使用。例如，在简单任务和链式减法任务中，加法处理单元不应向全局工作空间发送候选项和接收信息，而只在链式加法任务的比较操作之前这样做。

Gosmann（2015）提出的网络提供了一种使用NEF逐元素乘以两个向量的方法。因此，它可以用于将第i个处理单元输出到工作空间的权重通过注意力控制信号ai进行加权，并将从工作空间广播到处理单元的权重通过另一个信号bi进行加权。由于候选项是语义指针，每个处理单元的输出也需要转换为标量激活。处理单元的两个加权网络实现了以下动态：

小括号意味着加权是在语义指针的激活空间中进行的，而不是在语义指针空间中进行，这是为了效率，因为候选指针的数量比语义指针空间的维度要少。为了简单起见，视觉处理单元不从工作空间接收信息（即），运动处理单元不向它发送信息（即）。这并不一定适用于真实大脑，其中视觉处理受到自上而下的反馈调节，运动系统可以通知更高层次。

工作空间的第j个状态的输入是每个处理单元贡献的总和：

总之，尽管“联盟”这一概念在文献中没有明确定义，但这里提出的模型考虑了它的广泛描述，并为其数学形式主义奠定了基础。

4.4 路由器

在前一部分，我介绍了注意力和广播控制信号。它们必须根据要执行的任务和任务进展状态进行设置。这是由路由控制器完成的。如第3.2节所述，皮层-基底节-丘脑-皮层回路可以实现认知控制。更准确地说，它们可以在皮层区域识别生产规则条件的满足，并执行相应的动作。这里我提议，根据工作空间中的表示、处理单元中的表示以及存储任务身份和之前执行的生产规则的工作记忆组件来设置控制信号a和b。

4.4.1 工作记忆

从试验开始，任务（Task）被赋予与任务相对应的语义指针：简单（SIMPLE）、链式加法（CHAINED ADD）或链式减法（CHAINED SUB）。注意，这个过程不应该手动完成，而应该被建模为从屏幕上感知任务，并将该信息路由到任务。模型在试验期间的行为不受这个限制的影响，因为参与者在试验块开始前被告知要执行的任务。然而，它为模型的未来扩展留出了空间。

之前的路由（Previous Routing）是一个工作记忆组件，用于跟踪路由器最后执行的命令。其动态基本上与比较积分器（方程4.2）相同，但在语义指针所在的D维空间中。其积分时间常数用τr表示。

4.4.2 生产规则

路由控制器由一组实施生产规则的皮层-基底节-丘脑-皮层回路组成。侧抑制确保规则是相互排斥的（见图3.1）。由于回路最好与正效用一起工作，每条规则的效用都会获得一个恒定的偏置0.5。首先，一个具有恒定效用0.6的“阈值”规则（比偏置高出0.1）允许控制器在其他规则的效用较低时保持不活跃：

“获取视觉”规则在视觉或工作空间中表示N之前的固定十字时执行。它增加了视觉的处理单元的注意力控制信号，以便视觉内容进入工作空间。常数αa = 20确保处理单元的输出足够高，可以通过阈值Θ并获得访问工作空间的权限。此外，与其他规则（除了“阈值”规则）一样，规则的身份被发送到之前的路由（记为prev）：

“设置加法”规则在“获取视觉”刚刚执行并且模型需要执行链式加法任务时执行。它被选中，直到加法处理单元中有前意识内容可用（由ON的激活表示）。然后增加加法的处理单元的广播控制信号：

“设置减法”与“设置加法”类似，只是它在链式减法任务中执行：

“设置比较”稍微复杂一些，因为它可以在不同条件下根据任务执行：在简单任务中视觉内容被调用到工作空间时，链式加法任务中加法内容被调用时，或者链式减法任务中减法内容被调用时。

当“设置加法”刚刚执行并且加法处理单元中有一些表示成为前意识时，通过执行“获取加法”将该表示带入工作空间，这会增加相应的注意力控制信号。通常情况下，当从工作空间向加法处理单元广播N后，N ⊕ 2的结果成为前意识时，条件就得到了满足：

最后，一旦比较操作的结果被计算并发送到工作空间，就可以通过执行“设置运动”来报告它。注意，该规则的效用得到了0.5的正反馈，以维持运动输出，并停止执行其他规则，直到再次显示固定十字以准备下一个试验：

第5章结果

5.1 模型行为

在本节中，展示了模型执行三个任务（N ≶ 5?，N ÷ 2 ≶ 5?，N⊕2 ≶ 5?）的行为，其中N = 2。为了说明目的，参数设置为ωV→COM = 0.5，τr = 0.05，τc = 0.05和C = 0.25（这个参数在下一节中描述）。语义指针的维度设置为D = 96。

如图5.1所示，在持续250毫秒的固定十字之后，输入刺激呈现了29毫秒。然后模型正确地将信息发送到相关处理单元，并输出正确答案。由于视觉和比较之间的串扰连接，比较操作以N开始，并在链式减法任务中偏向错误答案（试验是不一致的）。Previous Routing的内容和工作空间分别提供了关于正在执行的路由规则和有意识表示的概念的清晰指示。当新的表示获得访问工作空间的权限时，电压呈现出类似P3组分的正波。在更受控的设置中（见图5.2）也可以观察到这一点。

在第4.2节中，我解释了工作空间如何能够整合多个不竞争的表示。这一点通过图5.3中的一个玩具示例进行了说明。特别是，整合既是同步的也是历时的。工作空间确实同时整合了来自过去（REMEMBER）的信息、当前的感觉信息（HEAR和SEE）以及计划中的行动（FEED），这一点受到了图2.2的启发。注意，与前一个示例相比，阈值增加了，因为有两个表示自我放大，而不是一个。

5.2 经验适合度

5.2.1 参数

使用第3.3节中描述的方法，拟合评估函数针对一系列参数进行优化，现在我将描述这些参数。组合集合中的神经元数量设置为100DC，其中D是语义指针的维度数量，C是缩放因子。这个值似乎可以调整与比较操作相关联的距离效应（见图5.4）。时间常数τc决定了比较积分器的积分速率，因此决定了比较处理单元决定输入是大于还是小于五的时间。τr驱动Previous Routing中的信息整合。因此，它影响了路由控制器选择新规则的速度。串扰连接ωV→COM预期会导致比较操作以N开始，而不是等待链式试验中执行算术操作。因此，这个参数可能调节第2.2节中描述的一致性效应。最后，未建模的感觉和运动处理所花费的时间，用θs表示，在每次贝叶斯优化调用中进行优化，如第3.3节所解释的。

5.2.2 优化

首先优化参数以适应反应时间（αRT = 1 和 αER = 0）。语义指针的维度设置为 D = 96。评估函数 L 的值收敛到最小值 10.55（见图 5.5）。图 5.6 显示了函数值如何随着各个参数和参数对的变化而变化。最佳拟合是通过最低的时间常数获得的，这表明人类在很短的时间内完成任务。同样地，C 不应该太低，尽管最佳调用时 C = 0.1。有趣的是，函数在参数空间的相对广阔区域内值较低。

图5.7显示了找到的最佳参数下模型的错误率和中位数正确反应时间。为了提高统计能力，模拟了更多的参与者和条件。与优化过程中每个条件执行两次不同，模型每个条件执行了十次。此外，模拟了30个“参与者”而不是10个。其中三个被排除在分析之外，因为他们在链式减法任务的任何试验中都没有正确回答。链式任务的中位数反应时间比简单任务高94毫秒（人类中的差异是85毫秒）。在简单任务中，最接近五的刺激（4和6）比最远的刺激（2和8）慢15毫秒（人类中是36毫秒）。最后，在链式试验中，一致性试验（刺激和图像落在五的同一侧）的中位数反应时间比不一致性试验（刺激和图像不落在同侧）低14毫秒（人类中是20毫秒）。为了检查这些效应的显著性，对反应时间进行了方差分析1。第一个方差分析以刺激（2, 4, 6, 8）和操作（N ≶ 5?, N ⊕ 2 ≶ 5?, N ÷ 2 ≶ 5?）作为因素。操作的效应是显著的（F(2) = 16922.572, p < .001）。也发现了刺激的显著效应（F(3) = 64.248, p < .001）。操作×刺激的交互作用也是显著的（F(6) = 72.356, p < .001）。为了测试人类和模型行为是否可以区分，进行了一个新的方差分析，将人类性（真或假）作为额外的因素。操作×刺激×人类交互作用不显著（F(6) = 1.394, p = .213），这为模型的有效性提供了强有力的证据。

对人类和模型的简单试验进行了另一项方差分析（ANOVA），以检查距离效应是否相同。因素包括刺激和人类。交互作用显著（F(3) = 5.967, p < .001）。事实上，图5.7显示，模型中的距离效应明显较小。随后进行了一项方差分析，以分析模型和人类中刺激-图像一致性的影响（仅连锁试验）。该分析将操作、一致性和人类作为因素。操作和一致性之间的交互作用显著（F(1) = 8.775, p < .005）。然而，由于操作×一致性×人类的交互作用不显著（F(1) = 2.222, p = .136），因此无法区分模型和人类的一致性效应。最后，为了研究连锁试验中潜在刺激和图像距离效应（相对于5）的存在，我们以刺激距离（近：刺激为4或6，远：2或8）和图像距离（近：图像为4或6，远：2或8）为因素进行了方差分析。所有主要效应均不显著（ps > .2）。交互作用显著（F(1) = 220.752, p < .001），但仅反映了刺激-图像一致性效应。原始研究中也报告了类似结果。

显然，该模型并未重现人类所犯错误的模式（图5.7）。更准确地说，简单试验中的距离效应和连锁试验中的刺激-图像一致性效应并未在模型中重现。事实上，模型在一致性试验中的表现更差。为确保这不是由评估函数（仅考虑反应时间）引起的，我们使用αRT = 1和αER = 1进行了新的优化。此外，还将语义指针的维度（D）（通常与性能相关）作为要优化的额外参数。尽管在反应时间中保留了距离和一致性效应，但这种方法并未提高错误率的适应性（图5.8）。

5.3 长任务上的表现

作为对模型的最终评估，我调查了它是否能够链式执行许多操作。任务是从零开始将一个数M增加M次，因此报告M。为了做到这一点，生成了M+1个数字语义指针（D0, ..., Di, ..., DM）。视觉处理单元被给予D0作为输入，模型必须通过M个加法处理单元链式传递信息，这些处理单元负责将它们的输入增加1。为了防止模型走捷径，第i个加法处理单元只能识别语义指针Di并输出Di+1。如果运动处理单元在0.25×(M + 2)秒内的某个时间点接收到Di+1，并且其激活至少为0.5，则试验成功完成。结果在图5.9中显示。

正如可能预期的那样，准确性随着语义指针维度D的增加而增加，随着要执行的加法数量的增加而减少。然而，模型能够在D = 128时，在82%的试验中执行50次加法并报告D50。因此，模型能够链式执行的操作数量比为其设计的任

在没有串扰的情况下，任务的执行是纯粹的串行的。因此，对于维度D对应的一次加法，应该存在一个成功概率pD。因此，成功执行M次加法的概率是。概率pD可以从模拟的准确性中经验估计：

数值11对应于模拟中使用的M值的数量（Mi = 2, 4, 6, ..., 50）。为了更好地预测，没有任何成功试验的条件被排除在计算之外（例如，M = 18, D = 32）。这种简单的方法正确地预测了模型的性能，如图5.10所示（r = .962, p < .001）。更具体地说，对于D = 32（r = .975, p < .001），D = 64（r = .961, p < .001），D = 96（r = .928, p < .001）和D = 128（r = .925, p < .001），相关性是显著的。

第六章讨论

我在这里提出的模型再现了与全局神经元工作空间理论相关的认知功能（第4节）。处理单元由几乎任何一组过程组成，它们竞争将自己的输出带入工作空间。正如图5.3所示，一次只能在工作空间中表示一个联盟，并且直到有新联盟通过某个阈值超越它之前都保持不变。有意识的内容被广播到所有处理单元的输入。门控机制调节每个处理单元发送信息的数量，以及每个处理单元可以使用有意识内容进行进一步处理的程度。关键的是，门控是根据要执行的任务及其当前进展来控制的。与Zylberberg等人（2010）的模型不同，我的模型可以执行许多步骤，包括在任何处理单元之间路由信息，只要表示空间中的维度数量足够大（第5.3节）。此外，工作空间中的神经元数量不随处理单元和符号的数量而扩展，而只与候选有意识表示的数量有关。

该模型在解剖学和生理学上是合理的。不同区域的神经常数与其生物学对应物一致。然而，工作空间神经元通常被认为是通过兴奋性连接连接的（Dehaene等人，1998）。尽管模型中使用抑制性和兴奋性突触实现了胜者为王的计算（NEF的默认模式），但可以使用NEF的扩展（Stöckel & Eliasmith, 2019）在潜在的计算成本下实现对连接的约束和更多的生物学细节。

据我所知，这是第一个解释联盟形成的神经模型。特别是，全局工作空间不仅执行感觉整合，还整合了不同时间窗口（过去和未来；图5.3）的信息。由于使用了SPA，这变得更加容易，因为矢量符号架构的绑定操作已被证明可以解决绑定问题（Gayler, 2004）。模型在这方面做出了一个有趣的预测。随着有意识联盟的大小增加，有意识访问的阈值也增加。这在创建模型时被预测（第4.2节）并在模拟中得到确认（图5.3）。这一预测可以在多感官最小对比度范式中进行实证测试。不幸的是，大多数与访问意识相关的研究都集中在单一的感觉模式（通常是视觉）上。

在Zylberberg等人（2011，不要与上述神经模型混淆）提出的框架中，每次执行生产规则都由P3成分索引。在我的模型中，有意识的内容并不直接与生产系统链接，P3波更多地索引有意识内容（图5.1和5.2），这与全局神经元工作空间理论一致（Mashour等人，2020）。处理步骤由“设置”和“获取”规则的执行特征化（在第4.4节中定义）。因此，使用相同的规则，框架预测一个步骤的执行由两个P3波索引，而我的模型预测只出现一个波（当结果在执行“获取”后进入工作空间）。这也可以通过实证测试。

https://theses.ubn.ru.nl/handle/123456789/10626

http://mp.weixin.qq.com/s?__biz=MzA5MDMwMTIyNQ==&mid=2649405563&idx=1&sn=1fa13e3a6e031814e43e988f891f69f4

CreateAMind

ALLinCreateAMind.AGI.top ，前沿AGI技术探索，论文跟进，复现验证，落地实验。鼓励新思想的探讨及验证等。探索比大模型更优的智能模型。