创造力的计算认知神经科学模型

科技   2024-11-24 12:18   上海  

Towards a Computational Cognitive Neuroscience Model of Creativity 创造力的计算认知神经科学模型

https://inria.hal.science/hal-03359407v1


摘要

最近在人工智能领域的进展扩展了可模拟的认知功能的边界,但创造力仍然是一个挑战。神经科学揭示了创造力的机制及其与情节记忆和认知控制之间的紧密关系,而机器学习则提供了这些机制的初步模型。我们介绍了这些研究方向,并解释了如何在计算创造力领域利用它们,以进一步扩展人工智能的能力。

关键词——创造力,显性记忆,情节记忆,前瞻性记忆,认知控制,想象力,计算认知神经科学,人工智能


I. 引言

创造力是人类信息处理的一个基本特征,但对机器来说却是一个历史上具有挑战性的任务。人们普遍认为它包括两个定义特征,即提出一个新颖的想法,并验证这个想法是否适合手头的任务[1]。它们分别被称为发散思维和收敛思维[2]。

尽管机器学习取得了巨大进展,人工智能模型仍存在一系列弱点,包括但不限于过拟合和转移能力差[3]。通过类比和想象力进行思考将是解决这些问题的关键因素。不幸的是,这些创造性功能似乎对机器来说仍然是一个挑战。然而,在[4]中声明“创造力不是魔法。它是正常人类智能的一个方面”。根据M. Boden的观点,我们认为创造力源于人脑的功能,因此应该通过研究其物理基础来更好地理解。因此,我们提议将计算创造力(CC)与计算认知神经科学(CCN)联系起来。已经在[5]中提出,目前在CCN中进行的建模工作旨在解决人工智能的当前局限性,这可能直接有利于CC,通过揭示负责发散思维和收敛思维的大脑机制。在这里,我们提议通过提供更多关于神经科学的最新实验和该方向的最新建模努力的细节来扩展这一观点。从这个角度出发,我们简要概述了人脑的记忆架构,更详细地讨论了被认为涉及想象力和认知控制的机制,这些机制参与了创造力。

接下来我们报告了实现这些机制的最新建模工作,并讨论了它们如何可能被适应到计算创造力(CC)中。


II. 人类记忆架构

A. 内隐记忆

在认知神经科学中,内隐记忆和外显记忆之间有一个主要区别,后者也分别被称为非陈述性记忆和陈述性记忆[6]。前者对应于世界上存在的规律性的缓慢学习。这种学习在当前的机器学习模型中得到了很好的捕捉,因为它们依赖于统计方法。例如,深度网络的层级架构在模式识别方面表现出色,有时被比较为感觉皮层的架构[7]。同样,最经典的强化学习方法,即演员-评论家架构[8],今天也是动作选择和决策制定的最佳模型之一。这些方法与基底节和前额叶最古老部分之间的回路相平行,即运动和前运动皮层(代表演员)和眶额皮层(代表评论家)。这些模型执行内隐学习,因为它们只是从试验和错误、标记模式中的规律性、状态的奖励值或感觉运动关联的统计分析中学习,而没有对世界结构的明确知识[3]。学习后,这些存储在权重中的值被隐式地利用以响应新案例。正如机器学习的最新成功所看到的,当有大量训练语料库可用时,这些方法非常成功,但它们有几个弱点,正是因为它们的学习是内隐的。在两种不同的机制的背景下研究了两组弱点,这两种机制都可能弥补这些弱点,都对应于构建一个外显记忆:情节学习和认知控制。

B. 外显记忆:情节学习

在深度网络中观察到第一组弱点,学习发生在具有分布式、集成和重叠表示的层级架构中。这就是这些模型可以泛化的原因,但代价是学习速度非常慢。相反,它们不擅长学习没有结构或规律性的数据。它们从全局方面到细节慢慢学习,并且它们忘记了它们接收到的个别案例。它们还对灾难性遗忘敏感:如果它们首先学会识别某种模式,然后学会识别另一种模式,如果它们没有定期回忆起之前学到的关联,它们就会忘记第一种识别,从而增加了学习的缓慢性。

在[9]中解释了海马体如何通过情节学习来补充皮层,以便哺乳动物大脑能够弥补这类弱点。这个大脑结构位于内侧颞叶,能够将皮层的大部分信息绑定在一起,并能够一次性学习当前的皮层激活。由于下面提到的皮层持续活动机制,这种激活代表了皮层处理的当前情节,因此称为情节学习。这种记忆是外显的,因为与皮层不同,皮层唤起从许多情节中获得的关系,这种学习明确地操纵个别情节。这与海马体信息处理的特定特征相关:一个基于稀疏编码的详细模式分离功能[10],以最小化学习新情节时的干扰,以及一个回忆机制,使海马体能够借助其独特的递归架构,从部分线索重建原始存储的模式。回忆与称为重放[11]的机制相关,重放会在皮层中重新激活存储的情节。这个过程有助于解决灾难性干扰的问题,因为当你在皮层中学习新能力时,已经显示在睡眠期间,海马体会重放其他类型的例子以平衡学习[11];这里重放的是明确和独特的情节,而不是统计隐性模型。这展示了我们记忆中知识(我知道)和技能(我知道如何)之间有趣的二元性。

C. 外显记忆:认知控制

现在让我们介绍与内隐学习相关的另一组弱点。强化学习模型在稳定的环境中非常强大,它们可以赋予状态和行为以价值,并相应地引导行为,而无需对世界的规则有明确的了解。如果需要学习的行为是依赖于上下文的,或者换句话说,当规则根据某些感知线索或内部信息(给出的指示或仅仅是情绪或动机)而变化时,情况就不再是这样了。一个内隐模型可能可以忘却旧的行为并学习新的行为,但这将需要时间成本。这与人类行为的灵活性不相符,人类行为可以在不同情境之间快速变化。此外,我们可以看到这种变化是明确的和深思熟虑的。在这种情况下,解决方案将不仅仅是依赖于内隐模型从外部信息提出的默认行为,而是要明确识别上下文,抑制默认行为,转而促进之前学习中存储的适当行为。这就是我们所说的认知控制:简单的决策制定依赖于感知来控制行为和促进某种行为,而认知控制依赖于外部和内部上下文线索以自上而下的方式控制行为。

神经科学早已知道,前额叶皮层(PFC)是负责这一功能的大脑结构[12]。这个结构在人类中特别发达(占皮层总面积的30%),其特点是能够显示出持久的持续活动,也称为工作记忆。在某些情况下,它能够抑制不适应的默认行为,并在很长一段时间内促进更合适的行为。这是通过偏倚皮层的活动来实现的,即通过注意力过程人为地增加皮层某些感觉区域的活动[13]。通过这种方式,非主导行为可以变得有资格并活跃起来。当规则变化时,工作记忆可以更新以促进另一种行为。决定规则是否已经改变(通过监测预期和观察结果之间的错误)和学习在工作记忆中保持哪些上下文线索分别是内侧和外侧PFC的角色[14]。在这些区域,神经元群体是根据任务的性质组织的[15]。已经显示它们沿着皮层表面的几个维度组织[16]。从前端到后端,可以观察到越来越抽象的规则。还有一个背侧-腹侧轴,腹侧主要涉及任务的语义意义的规则,背侧则控制任务的句法组织的规则。当错误表明规则已经改变时,可以立即测试其他已被证明对这项任务有效的规则,或者寻找在类似(即共享特征)任务中应用的规则。另一种提出的策略是通过混合旧规则来构建新规则[17]。正如下面讨论的,这些是创造力的关键机制。


III. 未来审议

A. 前瞻性记忆

我们已经解释了海马体能够将皮层的分布式活动绑定起来,以明确地创建一个特定情节的记忆,以及前额叶皮层(PFC)能够偏倚皮层的活动,以抑制默认的内隐行为,并明确促进在当前上下文中更适当的行为[18]。这里需要理解的关键是,海马体也从PFC接收信息片段,并将它们绑定在情节中,这些情节也送回PFC,从而参与其训练和激活。反过来,PFC接收在海马体中加工的上下文信息,并能够偏倚海马体的活动,以控制情节的存储和检索[19]。此外,现在广泛接受的是,记忆是一个(再)构建过程,几乎相同的回路不仅用于记忆(或重建)过去,还用于想象未来[20]。总之,海马体和PFC都通过学习一个明确的世界模型形成一个生成模型。通过从不同的情节中采样并预测行为的后果,它们能够内部模拟和评估候选策略。这就是我们所说的想象力,以及在思考过程中实现的东西[21]。

B. 创造力呢?

关于创造力的神经科学研究与这里给出的总体图景一致,并提供了额外的细节。[22]报告了一个有趣的fMRI实验,展示了在呈现新信息时,内侧前额叶皮层(mPFC)和海马体在重新组织记忆中的作用。在实验中,展示了一系列叙事视频,包括一些链接它们的线索,并激发参与者的洞察力(即突然发现问题的解决方案)。观察到这些时刻与新记忆表征的出现有关,而无关事件则被剔除。论文报告了激活海马体的个别事件和前海马体发出的不匹配响应被发送到内侧前额叶皮层。[23]报告了内侧前额叶皮层通过其背侧部分抑制自动常见想法的作用,并通过其腹侧部分允许灵活性和原创想法的产生。内侧前额叶皮层可以检测到多种解决方案的共存,包括非主导解决方案,并可以转移注意力以支持其中之一[24],创造力的原创性水平更与拓宽而非集中的注意力相关[25]。关于发散思维,洞察力被定义为对情境的重新解释以产生非主导解释[24],并以内侧前额叶皮层(用于冲突监控)和包括海马体在内的内侧颞叶(与洞察前语义整合相关)的激活为特征。在那篇论文中,还强调了情绪的作用,与语义处理的拓宽相关。这可能对应于由此类自下而上信息监控的自发创造力与由前额叶皮层自上而下监控的刻意创造力之间的差异[1]。关于收敛思维,在创造力期间观察到的前额叶皮层的自上而下控制中,验证新提出行为的语义和句法相关性是一部分,分别激活了腹侧和背侧区域[2]。有趣的是,在前瞻性记忆中,这种验证可以利用学习到的生成模型内部进行,无需实际行动。


IV. 计算方面

A. 外显记忆模型

尽管机器学习的最新成就主要与内隐记忆模型相关,但最近对外显记忆模型的关注越来越多,以提供更现实和灵活的模型。在强化学习中,例如,出现了情节和元强化学习[26],它们被引入以加速深度强化学习,其论点与上文提供的理由相同。在监督学习的情况下,概念器[27]的原则也被引入作为一种注意力过程,通过限制数据处理到数据空间的子区域。除了这些计算原则之外,还有其他模型具有更深的生物学基础。让我们首先提到一个能够存储和回忆情节的海马体模型[28],强调各种内部机制之间的相互作用。特别是,除了学习特定的情节外,这个模型还能够发现情节中的统计规律性,这被证明是传递性推理(即发现如果A与B相关,B与C相关,那么A与C相关)的潜在基础,这是创造力的一个重要成分。其他计算研究已经扩展了传统的强化学习范式,以解释海马体序列生成。例如,最近提出的一个模型解释了为什么以及海马体如何不仅能够重放经历过的状态序列,而且能够“想象”未经历过的序列[29]。关于认知控制,[14]实现了一个基于预测编码原则的神经元模型。检测到的预期和实际结果之间的错误被映射并与它们的上下文相关联,以便在检测到相同的上下文时触发更适应的行为。

B. 计算创造力呢?

据我们所知,目前很少有CCN模型明确涉及创造力,其中[17]和[30]是显著的例外。前者主要关注内侧PFC在创造力中的作用。它提出了一个生物学信息丰富的计算账户,解释了我们如何灵活地从一个规则集切换到另一个规则集,并解释了我们如何可能通过组合现有规则来创造一个新的规则集。在这个使用简单符号任务的模型中,没有考虑海马体的作用,这留下了很大的改进空间。在后一项研究中,提供了一个强调从多个来源绑定信息重要性的创造力计算账户。我们认为,目前缺乏的是一个专门针对创造力的海马体(任意绑定和情节学习)与PFC(控制编码、回忆和想象)之间相互作用的计算模型。我们相信,这样的模型不仅会实现受控的情节记忆,还会揭示“大脑构造系统”[31]在创造性地思考新情况及其任务相关性方面的能力(图1)。


V. 结论

在本文中,我们试图为基于认知控制和情节学习的CCN方法奠定创造力的基础。我们已经解释了几种模型提出了参与大脑中创造性过程的机制,但有几个特征需要更深入地研究。例如,大脑半球差异的作用在关于创造力的神经科学实验中经常被提及[24],而这种侧化概念在模型中大多缺失。我们认为,一个准确的大脑中创造力实现模型将解释实验发现,例如在音乐即兴创作期间观察到的外侧PFC的失活和内侧PFC的激活[2]。我们可以假设内侧PFC负责跟踪即兴创作中的错误,而外侧PFC实现的行为约束控制正在被抑制。

我们还相信,更好地理解与创造力相关的计算机制将极大地增强机器智能,考虑到它们在想象力、规划、决策、导航以及可以说是所有其他认知能力中的作用。一个详细的计算框架的发展可能会导致将创造力作为一种独特的人类能力的神秘化。更引人注目的是,创造力可能被简化为控制、记忆和决策制定的某些方面。




https://inria.hal.science/hal-03359407/file/IEEE_ICCI_CC_21.pdf

CreateAMind
ALLinCreateAMind.AGI.top , 前沿AGI技术探索,论文跟进,复现验证,落地实验。 鼓励新思想的探讨及验证等。 探索比大模型更优的智能模型。
 最新文章