说“人脑是计算机”,那是功能主义意识形态走火入魔

百科   2024-08-08 09:01   上海  

新书试读

 小鸟文学 

来自新近好书的试读章节,由小鸟文学编辑部从近期出版物中挑选而来。祝阅读愉快。

本文同步刊发于小鸟文学第四十四卷,为免费内容。

随着人工智能(AI)的惊人进步,关于“AI 是否已经有了意识”“AI 是否能演变成具有意识的存在”,以及“如何构建有意识的 AI 系统”等一类问题,开始成为学界和公众都关注的热点话题。

意识现代科学代表人物、诺贝尔奖获得者弗朗西斯·克里克(Francis Crick)的合作者——克里斯托弗·科赫就上述问题给出了独特的见解:如果要想对这类问题给出一种不受舆论裹挟的、理据充分且有信服力的判断和回答,我们就需要或者必须从意识理论中去寻找依据和答案。鉴于目前尚未出现受到普遍公认的意识理论,因此,继续致力于构建一个具备共识的理论体系,这既是意识的哲学-科学的崇高目标,亦是意识研究者的学术使命。

在《生命本身的感觉》中,科赫以理性的思维用神经科学、高等数学和生物学的科学态度来解释探索意识,总结出了整合信息理论,试图用该理论来阐明人类长期一直试图解决的“身心问题”,并对意识下了直接定义:任何的主观体验,从平凡到最崇高的——活着的感觉。

科赫不仅叙述了现代意识科学的诞生,而且阐述了其探索的隐蔽动机。本书讲述的内容是从意识神经生物学的当代研究前沿到作者对各类主题的反思,包括注意与觉知的区别、无意识、神经元的反应、自由意志的物理学和生物学。 

经湖南科学技术出版社授权,我们节选了第十二章《意识与计算主义》,分享给读者。

本书现已上市,点击【阅读原文】即可购买


科幻动作片《银翼杀手》(Blade Runner)中的瑞秋(Rachael)、好莱坞喜剧片《她》(Her)中的萨曼莎(Samantha)、惊悚心理片《机械姬》(Ex Machina)中的伊娃(Ava)、电视剧《西部世界》(Westworld)中的德洛丽丝(Dolores),这些角色有什么共同点呢?它们没有一个生来就是女性,不过它们都有迷人的女性特质,而且都是各个男主角梦寐以求的对象,这表明欲望和爱情也能延伸至这些工程造物中。

一个碳基演化的(carbon-evolved)生命与硅基制造的(silicon-built)生命之间边界日益交叠的未来正在高速地走向我们。随着深度机器学习(deep machine learning)的出现,现在的语音技术已经能达到接近人声,创造了热心的苹果语音助手(Siri)、微软人工智能助理(Cortana)、亚马逊语音助手(Alexa)以及谷歌助手(Google’s Assistant)。它们的语言技巧和社交魅力正在持续不断地提升,在不久的将来很可能会与真正的人类助手难分伯仲——除了它们将被赋予的完美记忆力、沉稳和耐心之外,本质上它们并不像任何有血肉之躯的生物。还要多久,会有人爱上他们的个人数字助手的脱离实体的(disembodied)数字语音?

数字助手迷人的声音是我们这个时代叙述心智是运行在人脑这台计算机上的软件的鲜活证据。意识不过是几个聪明的黑客。我们只是肉身的机器,没有什么优势,越来越不如计算机。用技术产业内鼓吹胜利主义者(triumphalist)的话来说,我们应为人类即将面临的淘汰而狂欢;我们应该感激智人(Homo sapiens)成为生物学和演化必将迎来的下一步——超级智能(superintelligence)之间的桥梁。硅谷精明的投资者是这么认为的,大量专栏文章也是这么写的,而当下时髦的科幻影片更是推波助澜,不断渲染尼采式意识形态中那种可怜的人类形象。

“心智即软件”(Mind-as-software),是这个极具流变的现代性社会和超越个体(hyper-individualized)、环游世界(globe-trotting)和技术崇拜(technology-worshipping)的文化中,占主导地位的神话(mythos)。这是一个在相信自己对神话有免疫能力的时代中依然存在的神话。这个时代,精英阶层如今困惑又漠然地注视着那个曾经支撑了西方世界 2000 年、无所不能的神话——基督教的垂死挣扎。

我在这里使用“神话(或迷思)”一词是遵照法国人类学家克洛德·列维-斯特劳斯(Claude Lévi-Strauss)的理解。也就是说,神话是明确和隐含地、有言和无言地指引人类的信念、故事、言论和行动的集合,它们赋予文化以意义。“心智即软件”是 一个无须辩护的、不言而喻的背景假定。这就像过去文化中的魔鬼的存在一样显而易见。除了“心智即软件”,我们还有别的选择吗?一个灵魂?得了吧!

事实上,尽管“心智即软件”与它的孪生兄弟,“脑即计算机”的想法在解释很多问题上相当便利,但当面对主观体验时,它却不过是一些贫乏的比喻,它表明功能主义的意识形态已经走火入魔了。与其说它们是科学不如说是修辞。一旦我们理解这个神话的主旨,我们就会如梦初醒,并惊讶自己之前为什么会相信它。“生命不过是算法”的神话既限制了我们的精神视野,也贬低了我们对生命、体验的看法,以及在时间的广阔循环中情识的位置。

让我们来看看潜藏于计算主义神话之下的东西,了解计算主义是什么,又从何而来。


计算主义:信息时代占支配地位的信念

我们这个时代的时代精神是:人类所能做的一切最终都可以被数字计算机取代。因此,它们也能成为人类所能成为的任何东西,包括拥有意识。请注意这个从“所为”到“存在”(from doing to being)的细微但关键的转变。

计算主义(Computationalism)或者说心智的计算理论是在英美哲学界、计算机科学院系、技术产业界中占统治地位的心智学说。它的种子早在 3 个世纪前就被戈特弗里德·威廉·莱布尼茨播下了,我们在第 7 章就谈到过他。莱布尼茨毕生致力于开发一种普遍演算(universal calculus),即推理演算(calculus ratiocinator)。他一直在寻找一种方法,将任何争议转化为一种严格的数学形式,以便以一种客观的方式来评估其真值。正如他写道:

纠正推理的唯一方法就是让它们像那些数学一样真实有形,这样我们就可以一眼发现我们的错误,并且当在人们之间出现争论时,我们只需说:无须多论,让我们计算一下,看看谁是正确的。

莱布尼茨的普遍计算之梦激励了 19 世纪末和 20 世纪初一个又一个逻辑学家,1930 年因库尔特·哥德尔(Kurt Gödel)、阿隆佐·邱奇(Alonzo Church)、艾伦·图灵(Alan Turing)的工作达到高峰。通过两个数学壮举,他们建构了信息时代的基础。首先,他们的工作对数学所能证明的东西施加了绝对和形式上的限制,从而终结了数学试图形式化真理、建立真理仪(alethiometer, truth meter)这个古老的、雄心勃勃的梦想;其次,他们创造了图灵机(Turing machine),这是一个关于无论是什么的计算程序如何被一个理想的机器评价的动力模型。

电影《模仿游戏》(2014)剧照

这项人类智力成就的重要性再怎么强调也不为过。图灵机是一个计算机的形式模型,简要地说,它需要四个部分:(1)一条无限长的纸带,用来记录和储存符号,比如 0 和 1 ,作为输入设备和存储中间结果;(2)一个扫描头(scanning head),它读取纸带上记录的符号并且能将它们改写;(3)一个包含着有限内部状态的简单机器;(4)一系列指令,事实上是一个程序,它完全规定了机器在每个内部状态中做什么——“如果机器在状态(100),并且此时在纸带中读取了符号 1 ,把状态转为(001)并向左移一格”或“如果机器在状态(110),并且读取了符号 0,停留在当前状态并写下符号 1”。差不多就是这样。任何数字计算机,不管是超级计算机或是最新型智能手机,只要能在这些数字计算机上编程的东西,原则上都可以被这种图灵机计算(也许会花很长时间,但那是实际应用上的问题)。图灵机已经取得如此标志性和根本性的地位,以至于“计算意味着什么”的现代概念也被认为是“可被图灵机计算的”[即所谓的邱奇-图灵论题(Church–Turing thesis)]。

这些关于可计算性的抽象观念已转变成占满整个屋子的机电计算设备,是在第二次世界大战时期为了提升炮弹表计算、自动化武器设计以及军事密码破解等不光彩的目的而诞生的。由固态和光物理学、电路元件小型化、大批量生产以及市场资本主义的力量[曾被著名的摩尔定律(Moore’s law)简要地概括为,一个集成电路上容纳的晶体管数量每两年就会翻倍]等一波又一波进步浪潮的推动,数字字计算机彻底颠覆了社会、工作的性质以及娱乐的方式。不到一个世纪,这些原本计算能力微不足道的巨型机器——ENIAC、UNIVAC、Colossus 以及同时期的类似机器——的后代把强力的传感器和处理器芯片装进了一个光滑的手持玻璃和铝制的外壳中。这些亲密的、个性化的、珍贵的人造产品,已成为人们须臾不可离手、随时要去翻阅查询一番的东西。这个惊人的发展丝毫没有展示出任何减速的迹象。


人工智能与功能主义

现代人工智能由两类机器学习算法推动,这两种算法产生于 20 世纪对视觉神经科学和学习心理学的研究。

第一类算法是深度卷积网络(deep convolutional networks)(“深度”意味数量巨大的加工层)。训练的方法是让它们离线接触大量数据库,比如标记过的狗类图片、度假照片、金融贷款申请或法英翻译文本。一旦以这种方式进行训练,软件就能迅速地从圣伯纳犬(Saint Bernard)中分辨出伯尔尼兹山地犬,正确地标记出度假照片,识别出欺诈性信用卡申请,或是将夏尔·波德莱尔(Charles Baudelaire)的诗歌“Là, tout n'est qu'ordre et beauté,. Luxe, calme et volupté”从法语翻译为英文“There, everything is order and beauty, luxury, calm and voluptuousness.”(在此, 一切都有序、美丽、奢华、平静且欢愉。)盲目地应用一条简单学习规则就可以将这些神经网络变成具备超人能力的复杂精细的查找表(look-up tables)。

第二类算法使用的是强化学习(reinforcement learning),它完全不需要人类的建议。当玩家可以通过最大化数值分数来实现单一目标(诸如在许多桌面游戏或电子游戏中)时,强化学习的效果就可以最好。软件以复杂的方式在模拟环境中采样所有可能的走棋空间,并选择能够最大化分数的走法。在与自己对弈了 400 万盘棋局之后,DeepMind 研发的围棋程序 AlphaGo Zero 达到了超人的表现。它实现这一目标只用了数小时,相比之下,一个有天赋的人要历经数年持之以恒的训练才能成为一名棋术精湛的围棋大师。它的后继者,诸如 AlphaZero,彻底终结了人类主宰经典棋类游戏的时代。现在,算法比任何 人都更擅长围棋、国际象棋、跳棋、多种扑克以及“打砖块”(Breakout)或“太空侵略者”(SpaceInvaders)等电子游戏。由于软件在没有人为干预的情况下也能进行学习,以至于这让许多感到不祥和恐惧。

在这些重要的进步发生前,计算机就已经为学者提供了关于脑如何运行的有力隐喻——计算范式或信息加工(information-processing)范式。按照这种说法,脑是一个通用图灵机——它将输入的感觉信息转化为对外部世界的内部表征。与情绪状态、认知状态和记忆库一起,脑计算出恰当的反应,并启动运动行为。我们是肉体做的图灵机,是未曾觉知自身程序设计的机器人。

考虑一个很常见的动作:将你刚刚看见的东西转成文字。你的视网膜以每秒 10 亿比特的速度获取视觉信息,当信息离开眼球时这个数据流减少至 1000 万比特。如果你很敏捷,你每秒可以输入 5 个字符,考虑到英语的熵,这相当于每秒 10 比特。对 阅读和口语的估计也差不多。以某种方式,由你的脑每秒产生的 1 万亿次“全有或全无”的峰值,将流经视神经的 1000 万比特数据转换成 10 个比特的运动信息。而同样的视觉运动系统可以迅速地被应用在骑自行车、用筷子夹起紫菜或是赞美朋友涂了新口红的行动上。

计算主义主张:心智—脑就像图灵机—样——它对输入的数据流执行—系列计算,提取符号信息,访问记忆库,将所有内容编译成—个答案,并产生恰当的运动输出。

按照这种观点,心智就是运行在脑这台湿漉漉的计算机上的软件。当然,脑神经系统不是一个传统的冯·诺依曼(von Neumann)式计算机——脑采取并行运算,没有系统范围内的时钟和总线(bus),它的元件以几毫秒的缓慢速度开启,记忆与加工也不是分离的,并且它使用模拟和数字的混合信号,但尽管如此它还是个计算机。具体细节无关紧要——整个论证是这样的;被执行的抽象操作才是关键。如果这台包裹在颅骨内湿漉漉的“计算机”执行的操作在相关的表征水平被在硅处理器上执行的软件忠实地模拟,那么与这些脑状态相关的一切事物,包括主观体验,也将会被计算机自动地模拟。解释意识只需要这些就够了。

计算主义是功能主义的一个变体。功能主义主张:一切心智状态,诸如愉悦的体验,与底层物理机制的内部构成无关。任何心智状态只依赖于它对这个机制而言所扮演的角色,包括它与周围环境、感觉输入、运动输出和其他心智状态之间的关系。也就是说,真正重要的是心智状态的功能。这个机制的物理学(即该构成该系统的质料以及将它连线在一起的方式)是无关紧要的。

计算主义:今天的主流的心智理论认为,脑(图中是按比例绘制的人脑和鼠脑)不过是一个类似图灵机的湿件,体验出自计算。这个心智即软件的强有力的隐喻已经变成了一个涵盖所有生命的神话

一些人支持功能主义更为严格的标准。为了拥有人类的体验,计算机不仅应当模拟我们的认知功能,还要模仿我们脑内所有具体的因果交互作用,例如在单个神经元的层面上。


论“脑即计算机”隐喻的使用和误用

信息加工范式的典型代表的是哺乳动物的视觉系统。视觉数据流从视网膜开始上升,到达皮层加工第一阶段的终点,即脑后侧的初级视觉皮层。从这里继续往上,数据被分至许多皮层区进行分析,直到它最终导致了知觉和行动。

来自麻醉状态下猫的初级视觉皮层的记录,哈佛大学的研究者大卫·休伯尔(David Hubel)和托斯坦·维泽尔(Torsten Wiesel)在 20 世纪 60 年代初描述了一组他们称之为“简单”细胞的神经元。之后休伯尔和维泽尔因他们的发现获得诺贝尔奖。简单细胞对放置在动物视野特定区域的倾斜的暗光带和亮光带做出反应。该神经元对视觉范围内的定向光线的位置特别敏感,而另一组称之为“复杂”细胞的神经元则并不那么关注光线的确切位置。休伯尔和维泽尔设想了一个视觉皮层布线图来解释他们的发现,这个布线图由数层细胞组成——第一层对应输入细胞,这些细胞携带着被眼睛捕捉到的视觉信息。它们对光点的反应最强。它们接着把信息输入道神经元的第二层,即简单细胞中,简单细胞把信息依次传递到第三层神经元,即复杂细胞中。

每个细胞都是一个加工元件或单元,它们计算其输入的加权总和,如果总和足够大,细胞就会启动输出;反之,它就会保持关闭。这些单元连结在一起的确切方式决定了对各个方位的边缘区域进行反应的输入层细胞如何转化成关注视野内特定位置的特定方位细胞。在随后的步骤中,这些细胞把输入提供给放弃空间信息而标记一条恰当方位的线的单元。深度卷积网络,即机器学习革命的基石,就直接继承这些早期绘制的关于视觉脑的简单模型。

后来在视觉皮层内发现了对面部产生反应的神经元,这一发现强化了这样的观点——视觉加工发生在不同层级的加工阶段中,其中信息向更高层级传输,从关注信息基本特征如亮度、方位、位置的单元向上传输到以更抽象方式表征信息的单元,诸如一般妇女的脸、祖母或影星詹妮弗·安妮斯顿(Jennifer Aniston)的特殊的脸。这种加工层的级联被称为前馈加工(正如小脑中的线路)。每一个加工阶段只对沿此线路的下一层产生影响,而不会影响前—层(影响前一层的话就是反馈加工)。

具有讽刺意味的是,尽管机器学习网络以人脑为模型,但皮层神经网络却显然不是前馈回路。确实,在所有皮层神经元之间形成的突触中,只有少数(不到十分之一)来自于前一加工阶段的连接。多数突触产生自它附近的神经元或来自更高层、更抽象的加工阶段中反馈回早期加工阶段的神经元。神经网络理论家不知道这些大规模的反馈连接是如何促进我们从单个例子中学习的能力的,而这正是计算机难以做到的。

即使是这种关于皮层分层加工的教科书式的观点——从原始的线状特征层上升到更抽象的特征——现在也正在被修正,因为对成千上万的皮层神经元的视觉反应的大尺度研究日益成 为实现,但是我们仍然禁不住要透过获得巨大成功的前馈计算技术这面透镜来解释脑运转的方式。

但是脑神经系统的诸多特征却在强烈挑战“脑即计算机”的解释。

考虑一下视网膜,这是眼球后部的一片精致的神经组织。它的大小约一张银行卡的四分之一,也没有厚多少,结构看起来就像—块黑森林蛋糕,三层细胞体由两层“填料”分隔开,这是所有突触和树突加工出现的地方。像雨点般输入的光子被视网膜内上亿个光感受器捕捉并转化为电信号,这些信号渗透多个加工层传递至数量约百万神经节细胞中。它们的输出线(即构成视神经的轴突束)将峰电位(峰电位是神经系统内通行用语)传输到广布在脑的其他部分中的目标。

视网膜的计算工作简单明确——把阳光普照的海滩或星光闪烁的夜景的光线转化成峰电位。为了完成这个看似简单的任务,生物学需要大约 100 种不同类型的神经元,每一种神经元都有独特的形态、分子特征和功能。为什么有如此多种神经元参与其中?同样的工作,智能手机内的图像传感器只需要动用每个像素(pixel)背后少量的晶体管。视网膜雇用如此多的专家有什么可能的计算合理性?

抑制性神经元在整个皮质层上是相似的,而兴奋性神经元,特别是锥体神经元,在不同区域之间是有区别的。这可能是因为它们将信息发送到不同的地方,这些地址的邮编被编码进这些神经元的基因中。不同细胞类型有不同的细胞形态,有各自敏感的神经递质,并且有不同的电反应等。一个脑由 1000 种以上乃至更多不同类型的细胞组成。下表列出了在自然演化的生命与机械制造的人造物之间的其他一些主要结构差异。

当涉及意识时,脑与数字计算机截然不同的体系架构造成了完全不同的影响。

计算隐喻确实还不足以解释这些令人惊讶的观察结果。理论告诉我们,仅仅两类逻辑门(表示“与”和“非”,或其变体)的组合就足以例示任何计算。一切都可以使用足够数量的“与”和“非”逻辑门来计算。数字计算机用少数几种不同类型的晶体管(包括功率晶体管和用于固态存储器的特殊触发器电路)就 可以工作了。

为什么不同的脑细胞会出现这种洛可可式的过度修饰?它有计算功能吗?我赌的是:各种细胞类型并非服务于计算效率,确切地说,它们是演化的、发展的以及代谢约束的产物。


全脑仿真

即使我们拒斥脑的计算观,但有一点毋庸置疑:计算机拥有强大的模拟脑的能力。这种能力最终会导致有意识心智的出现吗?

如今,单个突触、树突、轴突和神经元的运作原理已经被相当好地理解了。这些要素的动力学可以由非线性微分方程解释,即描述动作电位的启动和传播的著名的霍奇金·赫胥黎(Hodgkin–Huxley)方程的各种变式。这类方程被改进后大量地用于计算神经元之间突触的交互作用,瑞士蓝脑计划(Blue Brain Project)的一部分就是通过在超级计算机上运行这些方程来模拟一小片大鼠脑皮层内数十万神经元的峰电位的行为。这些研究模拟了一个脑切片内回响的脑电活动的动力学。将这种可靠的网络神经元模型扩展到拥有 1 亿个神经元的老鼠的整个脑,未来 5 年这在技术上将有可能。

然而这些进展并不能解决更有挑战性的难题:从分子水平到系统水平,我们对脑的复杂性知识尚且不足。计算机对脑的模拟中极大数量的参数需要被标以特定的意义——通道密度(channel densities)、受体绑定概念(receptor binding concepts)、耦合系数(coupling coefficients)、浓度(concentrations)等等。缺乏这些细节上的知识,神经工程学家不能为他们制造的脑模拟物真正注入生命。的确,他们能让软件做一些看起来很像生物的事,但这就像一个傀儡(golem),踉踉跄跄地走着,想要模仿一个真正的脑。计算神经科学难以启齿的秘密是,我们甚至依然没有秀丽隐杆线虫(C. elegans)神经系统的完整动力学模型,即便这种蠕虫只有 302 个神经细胞,并且它的“接线图”,即神经系统连接组(connectome)都已经被我们知晓。现在的我们,竭力想理解人脑,然而连蠕虫的脑都尚未攻克。

这也是为什么人工智能爱好者所提到的全(人)脑仿真[whole(human) brain emulation]还需要未来几十年努力的深层原因。我带着一定程度的确信说这些,是因为我自己就已经将大部分的职业生涯都献给脑神经线路的精确模拟研究中。我会在下一章讨论这种全脑的模拟是否会具有意识。

不同的文化透过它们最熟悉的技术来看待心—脑问题。柏拉图和亚里士多德把记忆想象成在一块蜡制石板上写字。笛卡尔设想有“动物精气”(animal spirits)根据水力学的原理在动脉、脑室以及神经微管中流过,其方式就像是使法国凡尔赛宫喷泉中的神、森林之神(satyrs)、仙女宁芙(nymphs)以及各式英雄的移动雕像赋有生机一样。到后来出现的隐喻将脑比作机械钟、电话总机、机电计算机、互联网,而今天又把它比作深度卷积网络或生成式对抗网络。

有趣的是,计算隐喻几乎不适用于人的肝脏与心脏。当科学家试图建立这些器官的精确计算机模型时,他们并没有从信息理论的角度考虑肝脏的代谢过程或心脏的泵送行为。这些隐喻的危险在于,我们没有注意到它们只是抓住了一个极其有限的方面。“世界是一个舞台”就是一句优美诗意的隐喻修辞,涉及了存在的某些方面,但现实是你我并不是被雇佣的演员,台下没有观众,也没有编剧给我们台词。


……

获取完整阅读体验

请下载“小鸟文学”app

题图为电影《机械姬》(2014)剧照

或在应用商店搜索“小鸟文学”👆 

本月🐦

欢迎你带着好奇心阅读小鸟文学
小鸟文学是个独立 App,它的表达在不停变化,认识它的人都有不同的机缘。此前你可能会从各种短篇小说、长篇访谈,人类学田野笔记或者和它的前身《好奇心日报》的联系认识到它,如今它还在持续作出调整。不过它的价值观一以贯之:和我们所处的世界保持距离,与此同时又不会袖手旁观。


📪联系我们
info@aves.art
新浪微博|豆瓣 @小鸟文学

小鸟与好奇心
你的头条不该只是些无聊事,让好奇驱动你的世界
 最新文章