图源:Freepik
为了更好地启发灵感,计算机科学中喜欢用一些描述人类大脑活动的术语如:“记忆”、“学习”、“神经网络”、“突触”、“偏见”,甚至,“梦”和“幻觉”等,但需要警惕的是,这些术语在人工智能的语境中,与日常语言中的含义是不同的。
撰文 | 皮尔路易吉·孔图奇
● ● ●
讨论AI是否是真正意义的智能可能会将我们引入歧途。目前更好的说法其实是人工智能确实存在智能,但是和人类的思维大相径庭。人工智能能够对话、推理、得出结论等,某种程度上与我们的思维过程类似,但却并不相同。因为在自然语言训练的过程中,我们并没有发现机器会产生逻辑能力。
从事开发人工智能的专家们其实更愿意称作为他们研究对象的人工智能为技术工具。这种技术工具的功能和人脑的认知功能相似。其中,从经验中学习和记忆、通过推理和逻辑解决问题,或者更泛化来说知识的应用和处理这些能力更加重要。他们喜欢这么定义是因为这么说更加贴合实际。因为这是把人类大脑和人工智能单纯的进行功能类比,并不会对两者进行更深入的讨论,可以避免一些误解和争论。
如果对标人类思维方式去构建人工智能,那么人工智能或者更泛地说,计算机科学中的一些术语就被确定下来:不仅是“智能”(intelligence)这个词,还有“记忆”(memory)、“学习”(learning)、“神经网络”(neural network)、“突触”(synapse)、“偏见”(bias),最近还包括“梦”(dream)和“幻觉”(hallucination)等术语。这些词都同时适用于描述人类和人工智能。把相同术语于两种不同的语境中的这种方式,可以说是信息技术革命带来的双刃剑:虽然对行业专家而言,这样更容易启发灵感;但一旦在公众讨论的时候,就特别容易导致滥用和误解。
说这些是为了给这篇简短文章提供一些背景:每个人对这些术语都有直接的个人感知,并且这些术语的含义也是有一定的社会共识,但将这些个人感知和含义直接套用到计算机的话,就会导致严重的误解。
01
想象一下,机器究竟是如何思考的?它们是如何推理的?它们是如何得出结论的?所有的人工智能归根结底是由两种截然不同的组件构成,这两种组件对应于两种不同的构想——因此也对应于两种不同的模拟人类智能的方式。
一种关注的是运用逻辑进行推理的能力,这种能力被认为是更高智能的体现。举一个贴切的例子。在数学里,我们可以进行加法、乘法,甚至执行更复杂的运算。我们所有的数学计算可以说是又敬又怕,因为要进行这些计算,我们不得不集中注意力,当计算变得特别复杂时,我们所需的时间会大幅增加。高效计算的方法会随着时间和实践而获得的,这也是专业数学家工作的重要组成部分。
逻辑在某种程度上是计算的抽象化;它也被视为支撑我们推理能力的基础。而计算机——从完全机械的安迪基西拉机(模拟计算机)到现代高效的电子计算机——在某种程度上都意味着自动化逻辑思维过程是有可能的。逻辑编程——本质上是一种非数字、概念化的语言进行编码的技术——这是上世纪发展出来和流行的人工智能技术。虽然这种技术取得了一些成果,但还有很大的局限性。例如,这种版本的人工智能从未实现图像分类和识别,也不能将文本翻译成不同语言。
与上述类型对应的另一种人工智能是从底层开始就模仿学习和记忆相关的生物意义的神经的运作过程,尤其是神经元之间突触连接的“可塑性”。在生物大脑中,记忆和学习的过程就是突触对外部刺激的适应过程。通过神经元和突触共同作用,我们既可以概念化和形成这些知识,也可以记忆这些知识。随着深度学习的不断发展,这种类型的人工智能目前增长速度很快主要得益于算力的提升和大数据时代的到来。现代人工智能从这些信息里提取有用的知识,从而可以做到一些之前只有人类可以执行的任务。
但需要指出的是,我们刚刚说的第二类人工智能是“前科学”。所谓“前科学”,就是指的是那些能够改变科学的部分,因为它们推动新的科学的产生,去解决新的问题。举个例子方便理解:想一下工业革命初期的第一批蒸汽机是如何产生的。这些蒸汽机不仅仅是一组杠杆和齿轮;它们还有燃烧室,蒸汽在那里扩张和收缩。这些发动机可以在没有马的情况下就推动火车车厢。尽管我们知道如何制造它们也知道工作原理,但我们仍然无法回答许多科学问题。例如:在煤耗相等的情况下,为什么柏林的蒸汽马车比巴黎的行驶得更远?为了解答这些问题就产生了一个新的科学理论——热力学,它引入了最大效率和绝对温度的概念,并提出了现代科学中最重要的量之一:熵。
同样的,现在可以与我们对话的计算机并不仅仅是由人手工编写的代码程序(例如,用于加分数的程序或用于操作“if-then”逻辑的程序,这些程序是计算机科学的杠杆和齿轮,是模仿更高智能的最初尝试)。现代机器还包含一个主动部分,它不再像十九世纪的机器那样将能量转化为工作,而是将原始信息(数据中包含的信息)转化为小而珍贵的知识片段。理解这些机器为何能工作——即识别它们的原理以及由此带来的性能限制,以便对其进行优化——是当今和未来科学的一个重要任务。
02
在过去的一年里,深度学习产生了像ChatGPT这样的系统,它能像人类一样流畅的对话,甚至让我们感觉好像真的在与人交流。当然,这只是表面的情况,事实如何呢?它是否达到了人类智能?是否超越了人类智能?是否真的通过了图灵测试?虽然这些问题无法在短文中中得到解答,但多一些思考总是有益。
在某些方面,计算机的表现早就远远超过了人类。但这并没有让我们感到太多不安,因为自从1970年代口袋计算器开始以超人类的速度进行大数计算以来就已经这样了。那时人们的自尊心——特别是他们自认为在宇宙中扮演的中心角色——并没有受到真正的威胁。事实上,我们很清楚,计算虽然很重要,但是它只是智力活动中的一个非常小的部分。我们发明,我们创造,我们绘画,我们写诗……我们所要做的就是稍微提高人类智能的标准,然后继续前进,就当都没有发生过。毕竟,机器早在很久以前就已经在力量测试中超过了我们,而计算能力只是在力量测试中战胜我们的又一个例子。关键是,近年来,我们被迫将标准提高很多,而且这种情况发生得很频繁。更关键的是,这些最新的能力并不能算成是新的力量测试。
我们继续深入探讨这个问题,但不涉及技术细节。我们已经说过,最早的人工智能是由程序员用显式代码编写的。计算机只是高效准确执行我们的指令。程序中包含的智能都是人类自己创造的;计算机仅仅用于计算。那么现在改变了吗?毫无疑问,现在已经产生了深刻且根本性的改变。
现在,程序员并不是“逐行”编写程序。他们只需编写一个算法,计算机去适应这个算法,然后从庞大的数据库中提取所需要的知识概念上,直到达到我们满意的精度。例如,从大量猫和狗的照片中学习识别猫和狗;从大量翻译示例中学习翻译等等。也就是说,没有程序员可以明确地写出执行这些操作的代码。最终程序所展示的“智能”在经过数据训练后获得的,不再仅仅是我们在手动编码中教给它的。它是否利用了计算的蛮力?当然!而且它还从数据库中提取并提炼出了某些在之前不存在的东西。
自从自动图像识别技术达到了超人水平以来,我就一直在使用“革命”这个词来形容这一技术——对,我说的就是和第一次工业革命中发动机革命一样的革命。第一台帮助人类的机器实际上是一组杠杆,这些杠杆加上人类的手臂就能够完成一些我们靠自身肌肉无法胜任的事情。然而在十八世纪末,发动机可不仅仅被视为通过杠杆运作的机器,因为发动机远不止于此。牛顿的定律及其拉格朗日方程都不足以解释它们的工作原理。一个全新的科学——热力学——占了主导位置:这是一门解答力学中未知原理的新科学,并且此后已成为力学的公理。
我们现在处于类似的境地:尽管机器学习由许多小的算法片段组成——每个片段都可以窥知它的细节——但整体的学习过程却以一种我们仍无法完全理解的方式进行。因此,我们需要努力研究,这意味着科学的改变并进入完全未知的领域。
03
回到思考的核心,运行ChatGPT的机器在“思考”什么?它聪明吗?简短的对话就足以让我们着迷。我们可以询问如何给孩子剪头发、如何回收混凝土、在与朋友发生争执后如何处理。回答过程中,认为程序是理解我们的非常正常。我们可以请它帮助我们选择大学专业或写一封情书。它所说的不仅合理且可信,而且还愉快、理性,甚至热情真挚。如果我们没被说服,我们甚至会产生争论。它确实有广泛的知识储备。
如果我们满足于表面的了解而不深入探究,那么它就超过最有文化的人。而如果我们再进一步调查呢?就会发现它各种各样的缺陷其实很容易被发现。例如,它提供的答案看起来真实,但不可靠。而且,它本质上不存在逻辑能力,它的强大实际上源于统计处理。
总之,我们再次面临一个问题,就是人工智能是否是真正的智能。我想说的是,这个问题本身就是伪命题。我们必须承认,某种程度上,人工智能确实是真正的智能,但它的智能和人类自身的智能本质上是不同的。它可以对话、思考、推理,并从假设中得出结论,尽管与我们思维非常相似——但并不一样。
作者简介:皮尔路易吉·孔图奇(Pierluigi Contucci)是一位数学物理学家,现为博洛尼亚大学的全职教授,曾担任东京理工大学、巴黎的庞加莱研究所和纽约大学的访问教授。)
(本文原文发表于于ASPENIA INTERNATIONAL, Vol. 1, 2024,《知识分子》经授权翻译转载。)