摘要:ChatGPT的成功引发了教育界对生成式人工智能广泛而又热烈的讨论。在此背景下,以深度学习为线索对生成式人工智能何以构成教育奇点予以追问,意在从前提上把握生成式人工智能之于教育的突破和局限。从深度学习的突破来看,生成式人工智能之于教育的深层价值在于擘画了指向算法决策的新方向、指向大模型的新范式、指向智能机器的新赛道;从深度学习的局限来看,教育极有可能因为生成式人工智能而面临不可知、不可用和不可信的风险。这对热衷求证生成式人工智能何以构成奇点的教育而言,仍不足以构成可谓确切的答案;但对试图诉诸更有深度的概念、问题、目的以创造奇点的教育而言,却不失为有益的启示。归根究底,与作为时下人工智能重要方向之一的深度学习相比,对人工智能跨领域、长时间、多层次、辩证性的深度理解更有可能引申出教育奇点。
关键词:生成式人工智能;奇点;深度学习;深度理解;算法
中图分类号:G434 文献标识码:A
* 本文系教育部人文社会科学青年基金“双减背景下教师适应性测评与优化机制研究”(课题编号:22XJC880006)、广州市教育科学规划重大课题“广州市义务教育发展监测方法与模型构建研究”(课题编号:2021zd001)研究成果。‘
引用请注明以下信息:
杨欣.生成式人工智能何以构成教育奇点——从深度学习到深度理解[J].中国电化教育,2024,(10):33-42.
一、为何追问生成式人工智能是否会带来教育奇点
ChatGPT展示了生成式人工智能之于人类社会的技术效用,也让生成式人工智能一跃成为了教育数字化转型中最受人关注且更能代表人类未来想象的技术路径,更令不少人开始期待通用人工智能的到来。与此同时,从围绕生成式人工智能的教育研究来看,它们中的不少观点或始于、或支持了库兹韦尔在《奇点临近》一书中的论断,“什么是奇点?奇点是未来的一个时期:技术变革的节奏如此迅速,其所带来的影响如此深远,人类的生活将不可避免地发生改变”[1]。加之考虑到,当下奇点一般表述为由超越现今人类并且可以自我进化的机器智能或者其它形式的超级智能的出现所引发[2]。由此可见,人工智能已经构成了最能代表奇点的概念与符号,而生成式人工智能作为时下最受关注的人工智能方向,更可谓集奇点的想象于一身。反言之,如果人们不是假设生成式人工智能有可能让人类生活发生不可避免的重要改变,那么由ChatGPT引发的热议又是为了什么?如此一来,追问生成式人工智能是否会带来教育奇点也就构成了一个意味深长的学术话题。要知道,即便奇点出现的概率很微小,但它却可能对教育造成颠覆性的影响。所以,前瞻性地思考生成式人工智能何以构成教育奇点就显得颇为重要。其中道理如库兹韦尔所言,“理解奇点,将有利于我们改变视角,去重新审视过去发生的事情的重要意义,以及未来发展的走向”[3]。具体到教育,生成式人工智能的本质是什么?与其他人工智能相比,它的突破在哪?它为什么能取得突破?它的突破是否等价于教育的进步?它的突破究竟会让教育产生怎样的变化,而哪些变化又是前所未有的?面对种种犹未可知之处,教育中人应如何予以认知、应用和授信?当人们开始思考这些问题时,奇点的探讨不仅能在教育中获得一席之地,生成式人工智能的本质也将在教育中得到解蔽,生成式人工智能何以构成教育奇点更将因此得到新的探索和澄清。现如今,奇点已经因为库兹韦尔的《奇点临近》而成为了一个颇为新奇且流行的技术概念。但如果不对奇点理论加以批判性理解,那么技术便不再是现代性语境中“除魅”世界的理智化力量,而是被着上了宗教的灵韵和救赎的魔力,变成了一种“复魅”世界的虚假性力量和欺骗性力量[4]。更重要的是,不少科学家已经指出“库兹韦尔陷入了用人类可以理解的技术来解释人类智能的陷阱”[5]。类比到生成式人工智能,所谓“奇点是否临近”完全取决于人对它的理解,若人理解不了这种技术便是“奇点未临”,人可以理解这种技术之时便是“奇点已临”。对此,人们可以用沙纳汉在《技术奇点》中的话作为回应,“这些观点中有很多可以质疑的地方,但同样不可理喻的是把相信人工智能对人类存在重要性的人指责为狂想家”[6]。但必须承认的是,这样的批评其实道出了奇点研究的深层弊端,即片面依赖人类可以理解的技术。这也反过来表明,若要真正理解奇点之意,就必须超越“人类可以理解的技术”这一前提。事实上,从奇点研究的起源来看,它既非诞生于技术发展的概念,也非技术所专属的概念。甚至于,奇点在不同领域拥有不尽相同的内涵。比如,在数学领域,奇点意味着未经定义的点;在物理领域,奇点标志着大爆炸宇宙论所追溯的宇宙演化起点;在技术领域,冯·诺伊曼第一次提出了“奇点”这一概念,并将其表述为一种可以撕裂人类历史结构的能力[7]。综合数学、物理和技术的奇点内涵来看,奇点就好比“数学中Y=1/X函数曲线上X=0的点”“物理学上引力接近无穷大时产生黑洞”亦或“信息技术中的通用人工智能”一般,它除了指向加速发展或者带来爆炸式改变,更因为这样的发展与变化超出了一般正常模型所能预测的范围,所以奇点终将指向某些未知区域。据此而言,不具技术偏见的奇点可以概括为技术大爆炸所构成的加速发展及其未知区域。其中,大爆炸指向技术的本质性变化,人类加速发展立足于“人类可以理解的技术”,未知区域则是以“不被人类理解的技术”为前提。相应地,本文对生成式人工智能何以构成教育奇点的探讨,亦可从“大爆炸”“加速发展”与“未知领域”分别探讨生成式人工智能之于教育的变化、突破和局限。最后需要说明的是,本文之所以选择从深度学习的视角去澄清生成式人工智能何以构成教育奇点,一方面是没有一个概念如生成式人工智能一般既被重视又被误解,也没有一个概念如奇点一般在被人赋予诸多想象的同时又能刺激更多人的幻想,所以,也很难有像算法这般“身为人工智能种子”[8]与“解构教育深层问题的前提”[9]的视角,既有益于从根本上澄清生成式人工智能的突破与局限,也有益于从前提上解构生成式人工智能之于教育的大爆炸、加速发展与未知区域,更有益于在当下凸显深度理解之于教育奇点的不可或缺。正如人们不应将17世纪的科学革命片面归功于印刷机,当下生成式人工智能的大爆炸也不能一味归因于GPU(Graphics Processing Unit,图形处理器)。要知道,即便生成式人工智能的成功离不开GPU,但若仅仅只看到基于GPU的算力爆发,而不考虑支撑起这一切的算法基础,这无异于撇开牛顿三大定律将科学革命归功于古腾堡发明的活字印刷术。正因此,即便库兹韦尔在《奇点临近》中不断强调技术跃迁的重要性,但他却在前言中写道,“技术的咒语便是蕴含于现代魔术之中的公式和算法。只需应用正确的序列,我们就可以让电脑朗读书籍、理解人类语言、检验并预防心脏病,甚至预测股市行情。哪怕咒语有点差错,魔法就会被削弱,甚至不起任何作用……通常,技术上一个显著的进步往往源于一个对公式进行较小的改动”[10]。在此意义上,如果说GPU是生成式人工智能的“燃料”,那么,深度学习则是点燃生成式人工智能的“火燧”。反言之,若没有深度学习这样的算法构思,GPU的用武之地从何而来?生成式人工智能构成的教育奇点又从何谈起?所以,如今的生成式人工智能大爆炸理应从深度学习谈起。支撑起如今深度学习的神经网络可以追溯到20世纪50年代伊始,由于维纳提出的“基于机器和生物中的通信和控制系统的控制论”得到了广泛关注,随后,罗森布拉特从模仿人脑的数学系统中获得启示,发明了一种看似简单的感知机(Perceptron)[11]。该机器的独特之处在于它背后的神经网络算法,即“如果已经存在这样一组权重,并且有足够的训练样本,那么它肯定能自动地找到一组合适的权重”[12]。与如今生成式人工智能类似之处在于,该感知机的设计目的是识别周围的物体,而不需要程序员提前预测各种偶然事件。罗森布拉特发明的感知机一经问世便引起巨大轰动[13]。此后,罗森布拉特的感知机可谓好评如潮且风靡一时。不过,在彼时社会的巨大期望面前,罗森布拉特自己却对感知机抱有相当谨慎且清醒的认识。他不仅宣称,感知机不是在人工智能方面的尝试;更表示,该机器拥有明显的局限[14]。可即便如此,基于神经网络的人工智能想法还是在罗森布拉特的控制下逃出了“实验室”。后来的历史表明,由于受制于硬件和算力,以及明斯基和帕普特在《感知机》一书中对神经网络局限的根本性批评,神经网络的寒冬随之而来,直到辛顿研究团队在内的一群人找到了利用强大的GPU去大幅提升神经网络的方法,并由此掀起了基于深度学习的人工智能变革。从跌宕起伏的深度学习历史来看,尽管它拥有的硬件基础和算力供给已不可同日而语,但它与神经网络之间的概念关联仍然无法割舍。历史地看,1962年由罗森布拉特出版的《神经动力学:感知器和大脑机制的理论》最早详细介绍了一种应用于具有单层可变权重的神经网络模型的学习算法,该算法便是今天深度学习的前身。现如今,深度学习其实是指机器学习的一个分支,它根植于数学、计算机科学和神经科学。它的本质在于,通过建立、模拟人脑的信息处理神经结构来实现对外部输入的数据进行从低级到高级的特征提取,从而使机器能够学习数据并给出解释(给出数据的分层特征表示)[15]。通俗而言,深度学习意为从数据中学习。这也意味着,基于神经网络的深度学习可以尝试从数据中学习一切所需,而不再依赖手工编程建构的知识以及相应的计算机程序。所以,深度学习其实代表了这样一种可能,“为机器提供足够、适当的数据,它能发现相应的知识;给它视频流,它会观看;给它图书馆,它能阅读;给它物理实验结果,它会发现物理规律”[16]。对此,用谢诺夫斯基的话来总结便是,“如果数据是新时代的石油,那么学习算法就是从中提取信息的炼油厂;信息积累成知识;知识深化成理解;理解演变为智慧。欢迎来到深度学习的新世界”[17]。概言之,深度学习仍然属于基于数据和算法的人工智能,只不过随着算力的爆发,它表现出了更多令人惊喜的内容。从人工智能的内涵及其边界来看,深度学习与人工智能之间的关系服从以下规律,人工智能>机器学习>深度学习,具体如图1所示[18]。具体来讲:(1)人工智能包括机器学习,也包括非机器学习的类型,比如规划式人工智能、推理式人工智能;(2)机器学习包括深度学习,但也包括非深度学习的算法,比如遗传算法、概率学习。由此推知,就算基于深度学习的生成式人工智能代表了学术界、产业界、实务界甚至教育界最受关注且最易获得投资的人工智能方向,但正如生成式人工智能不是人工智能的唯一技术和应用,深度学习既非机器学习的全部内涵,也代表不了人工智能的全部未来,更支撑不了人们对奇点的全部想象。反倒是,多明戈斯在《终极算法》一书中所提观点更加发人深省且富有教育意味,“不同算法对其中心问题的解决方法都是一个辉煌、来之不易的进步,但真正的终极算法需要把五个学派的五个问题都解决,而不是只解决一个”[19]。这也意味着,“对不同算法的深度理解,以及多种算法的融通”更有机会引申出人工智能的奇点。以ChatGPT为代表的生成式人工智能,既用自己的流行和成功揭示了深度学习的突破,也用自身面临的非议和风险凸显了深度学习的局限。要知道,在20世纪70年代后的相当长一段时间内,人工智能领域的某种普遍共识是,所谓的神经网络方法是没有希望成功的,因为与其他方法相比,神经网络不仅实现难度更大且效果不如其他方法[20]。只不过,以辛顿、杨立昆、本吉奥为代表的计算机科学家在长期不被主流学术圈认可的情况下,仍然坚持深度神经网络会改变世界,进而在黑暗中持续探索多年之后,终于推动了基于深度学习的人工智能突破性进展。在此意义上,ChatGPT的突破性价值并非它能在多大程度上媲美(或者超越)人类智能,而是它背后的深度学习预示了人工智能的新方向、新范式和新赛道。其一,人工智能的新方向。选择深度学习意味着,计算机科学家不必再细致定义机器应该如何运行,而是“使用算法替代部分传统上人工进行的决策”[21]。正因此,ChatGPT之于人工智能的创新意义在于,计算机科学家们有机会突破基于图灵机的人工智能架构,去构建可以自行判断如何执行下一步程序的神谕图灵机(即世俗意义上的通用人工智能)[22]。换言之,ChatGPT只是触摸到了弱人工智能(机器能够智能行动,看起来有智能)和强人工智能(机器确实在思考,不只是模仿)的边界。所以,深度学习其实是指出了通过算法进行决策的人工智能新方向,而不是给出了通用人工智能的答案。其二,人工智能的新引擎。ChatGPT的核心工作机制是提示学习(Prompting),该机制去除了模型对数据的依赖,或者说它解放了大模型,不再走多任务、子任务的训练路向,而是借助大模型已经拥有的全局数据内在统计概率的优点,以生成任何内容[23]。如此一来,大模型也就构成了比大数据更加值得关注的人工智能发展引擎。其三,人工智能的新赛道。当下算力已经因为ChatGPT成为了全球共知且各国争相布局的科技新赛道。除此之外,人工智能行为体(AI Agent)亦可能因为ChatGPT而成为另一条不易为人所知却影响更加深远的科技新赛道。AI Agent是一个在人工智能领域拥有近30年历史的概念,意为能够自适应环境的自主控制系统[24]。在没有ChatGPT之前,训练AI Agent只能通过强化学习等有限手段,而大模型的出现让计算机科学家找到了新方向——从过去发明给人用的软件到发明给机器用的软件[25]。由此可见,深度学习除了指向算力的竞争,也指向了AI Agent的竞争,即如何构建更加智能的机器。与上述突破相对而立的另一方面则是,深度学习的局限正日益凸显。首先,深度学习的“不透明”。随着像深度学习这样的机器学习不断发展,算法结论将愈发难以解释[26]。长期来看,这样的不透明不仅会带来“技术黑箱”“隐私侵犯与侵权”“智能造假”等问题,还将严重损害教育对深度学习的信任感和掌控感。其次,深度学习的“贪婪”。算力爆发成就了ChatGPT这样的大模型,反言之,若要构建超越ChatGPT的大模型,那么它所需要的算力也将是惊人且难以估量的。相应地,算力的供给与分配也将伴随着深度学习的成就衍生出“数字贫困”“算法霸权”“数据鸿沟”等问题。再者,深度学习的“错误”。正如ChatGPT会在一些复杂问题与陌生问题上“不懂装懂”,亦或因为系统设计或者系统更新而莫名其妙的“胡说八道”。所以,人们既可能无法用深度学习来探索未知的数据空间,也难以直接用它来做数学证明和科学探索。更糟的是,“内容污染”“超脱现实”“网络谣言”也将因为深度学习的流行而演变为难以克服的社会问题。必须指出的是,正是鉴于深度学习的不透明、贪婪和错误,所以即便ChatGPT能为人们提供不少便利,但由于它既无法保证在人迫切需要解答问题时为其提供正确答案,也不能保证自身在无法给出正确答案时,人们能想出办法找到问题所在,继而排除故障。所以,ChatGPT更像是人们在“照镜子”,它反映的亦不过是人类自身的思想、意识以及当前多数人的倾向,而它的结果非但不能代表正确的真理,反而更像是人们在和由集体记忆构成的幻想进行对话[27]。由此看来,深度学习既可能加重人类自欺的“思想悲剧”,也可能在未来某个时刻因为无益于切实解决问题而沦为被放弃的“技术悲剧”。这也是为什么生成式人工智能越成功和流行,人们越要对其保持警醒的根本缘由。智能时代越是向前,深度学习之于教育的驱动作用也将越发明显[28]。不过,深度学习能否驱动教育的加速发展,并不简单取决于它本身有多么高明、强大和美好,而是要看教育是否契合深度学习的前置条件。反言之,如果教育加速发展不受此限制,那么这样的发展要么与其他技术混为一谈,要么带来无休止的误解与滥用。因此之故,在回答深度学习如何驱动教育加速发展之前,有必要阐明“何谓有限”。(1)立足深度学习的本质,即基于数据与算法的人工智能。(2)把握深度学习的范畴,即充分理解深度学习与机器学习、人工智能之间的关系。(3)凸显深度学习的突破,即强化深度学习的新方向、新引擎、新赛道。在此意义上,深度学习驱动教育加速发展的支点是算法决策、大模型与智能机器。(4)约束深度学习的局限,即在教育中警惕深度学习的不透明、贪婪和错误。反过来讲,深度学习驱动的教育加速发展有必要保持清醒的认知、寻求必要的解释与坚持严谨的论证。在上述前提之下,深度学习驱动的教育加速发展意味着算法决策、大模型和智能机器有机会让教育在现有基础上变得更高、更强、更好。如果将如今深度学习的硬件优势、训练优势和鲁棒优势,与数字平台的搭建、数据资源的挖掘、“人-机”交互的设计相结合,那么在教育中使用算法替代部分传统上人工进行的决策操作也就成为了可能。比如,一是治理风险,人们既可以在教育中尝试应用算法以提前感知风险,也能借助其自动监测算法风险。从“感知歧视的数据挖掘技术”(DADM)的来看,“监督算法运行的技术”不仅已经具有较高的可靠性,而且它们的应用也正处于日益成熟的阶段[29]。它意味着,诸如深度学习这类机器学习算法能够以自动化运行的方式检测出教育中其他算法是否存在身份歧视等有违公正伦理要求的情形,并发出预警,从而有效化解潜在的教育风险。二是规范行为,通过算法的路径规划,让人的行为建立在教育预期之上。比如,通过算法对教育行为进行排序、分类、关联和筛选,亦或强化、推荐、生成、推动与教育预期相符的规范行为[30]。三是决策创新,将教育决策建立在“算法预测+人的判断”之上。决策者一方面可以借助算法对不同群体所需信息、反应意见进行及时、快速、准确的分类与可视化处理,以便及时地掌握教育中的“痛点”“难点”或“盲点”;另一方面可以借助算法扭转决策与行动之间的信息不对称,以及打破长期存在的领域(学科)壁垒与科层藩篱,以便实现统一且有效的教育决策[31]。必须指出的是,正是考虑到深度学习存在无从克服的局限,算法决策并不能替代人的判断,所以,算法决策对教育的创新意义在于,通过算法客观呈现预测结果(模拟结果),以便人类决策者作出超越自身局限的科学决策。而要实现这一点,除了需要在教育中对算法与人进行分工,还要为算法决策设定必要门槛与基线,更要加强培养人类决策者的提问能力、鉴别能力和综合能力。自2012年美国前总统奥巴马提出“数据是未来的石油”的看法以来,大数据便成为了世界各国争夺人工智能技术高地的关键领域。与之不同,从ChatGPT的技术基础来看[32],相比于大数据,大模型不仅从前提上决定了人工智能需要什么数据与关注什么数据,还在逻辑层面规定了数据收集、数据清洗、数据分析和数据呈现的应用路径。而这种新认知非但不会损害大数据的已有基础,还会鼓励人们从另一个视角认识大数据,即“我们拥有这么多的数据,究竟要用它来干什么”。在此意义上,大模型既有益于摆脱教育的数据依赖,也能让已有数据更好为教育所用。从当下教育领域的大模型探讨来看,强调应用也已经成为了某种共识。比如,在英国、美国、日本、澳大利亚,都在探索(或者尝试)将以ChatGPT应用于教育实践[33];在我国,“多模态汉字学习系统”[34]与“多模态大模型驱动学科知识图谱”[35]也已开始尝试应用于教育实践。实事求是而言,尽管教育大模型的应用正如雨后春笋般涌现,但这些应用是否适宜教育、是否能重塑教育生态亦或带来更好的教育仍然有待观察和验证。除此之外,与存在算力极限、模型幻觉且成本高昂的大模型相比[36],轻参数、低成本、方便运行的小模型是否更加适合教育,仍是个有待讨论的问题。所以,教育在欢迎大模型的同时,尤有必要坚持自己的态度和思考。无论是人们担忧深度学习指向媲美甚至超越人类的人工智能,还是将其斥之为不足与人相提并论的人工智障,其实都是陷入“拟人诅咒”——以“人”为想象人工智能的蓝本。要知道,虽然深度学习借鉴了人类信息处理神经结构,但它既不是人,更以不依赖人为特色。反言之,“以人为本”固然有助于预防/消解深度学习的不良影响,但若因此把人视作用深度学习驱动教育发展的蓝本,这非但无益于人理解深度学习,反而有可能误导深度学习的教育应用。比如,将ChatGPT改装为某种“素养”或者“能力”,然后开启人们相互比较的赛道。但正如前文所表,ChatGPT其实是代表了训练智能机器的新赛道。因此,与用深度学习开启人的“军备竞赛”相比,打造更好的“模仿人类和其他动物的感知、运动、操作乃至交流的智能机器”[37]或许更能代表基于深度学习的教育加速发展。比如,指向模拟人类情境感知、生物感知与社会感知的智能教学应用;以ASIMO、Alpha Ebot、Nao为代表的两足教育机器人[38];智能学伴、智能导师、智能助手这类立足于“人机交流”的智能机器。如果说由深度学习驱动的加速发展,是要以“人类可以理解的技术”为前提进行正向推理,那么,始于深度学习的未经定义之处则是要以“不被人类理解的技术”为前提进行反向推理。首先,既然深度学习是个不透明的“黑箱”,那么人们又凭什么理解这些未知的结果了?其次,既然深度学习对能源和算力的需求如此巨大,那么什么样的教育问题值得诉诸深度学习这般大费周折?再者,既然深度学习存在无从克服的错误,人们又何以相信深度学习一定导向更好的教育未来?上述未知、复杂和不确定既无法在“人类可以理解的技术”的前提下被关心和回答,也无法在教育的加速发展和大爆炸中被自动消除,却关系到生成式人工智能之于教育是否可知、可用和可信的前提。生成式人工智能作为人类探索世界的工具,若要像望远镜一般将人的认知拓展到前所未有之处,就必须如同伽利略一般解决以下难题,“为什么望远镜数据应该被当作比裸眼数据更加优秀的结果而加以接受”[39]。而伽利略解决这一问题的方法便是用“光渗现象”向世人证明,人类的直观观察并不可靠,进而表明了用望远镜探知行星的可靠性[40]。由此带来的教训便是,若要真正拓展人类的认知范围,就必须使人意识到自身的有限性,并诉诸公开的途径进行理性的检验。这一点不止适用于望远镜,同样适用于生成式人工智能。一方面,人工智能已经迫使人意识到,自己在逻辑、信息处理和智能行为领域的主导地位正面临严重威胁,人类不再是信息圈毋庸置疑的主宰,数字设备正代替人类执行了越来越多的原本需要人的思想来解决的任务[41]。另一方面,深度学习之于人类认知的最大启示便是,它不可能、也没必要简化为所有人能够理解的东西,否则,它也就失去了自身的价值[42]。由此带来的教训便是,正因为人类的千年经验积累与个人的认知天赋抵不过“不知疲倦”的人工智能,所以人们有必要意识到自身在人工智能面前的认知有限性;同时,正因为存在以人类直观与经验无法理解的复杂现象,所以,教育需要诉诸深度学习以处理这些问题。必须指出的是,在深度学习上接受人类认知有限以及由此构成的未知,并不等于深度学习之于教育的不可知,甚至放弃理解深度学习的教育努力。若要使人真正接受始于深度学习的教育结果,那些真正理解深度学习与人工智能的人就必须站出来,并必须诉诸理性途径予以阐明。这一方面要求那些懂得深度学习原理及其应用的数学家、科学家、工程师、技术专家能够有机会进入学校(教育场域)发声,以便教育中人获得超越一时表象、一家之言、一事得失的深层洞见。另一方面则意味着,所有教育领域的智能应用都有必要事实、数据、实验以及理性观念的尺度上得到公开检验,以迈向贝叶斯求知路径——“真理越辩越明,新证据不断出现,科学观点总能汇集到一起并且向真理逼近,无论计算的方法和结果怎么变化,只要踏上了贝叶斯之旅,所有正确甚至错误的观念都有机会得到审视,直至走向真理”[43]。当教育愿意在有限认知之上理性接受自身的未知之时,生成式人工智能或许也能像当年的望远镜一般开启全新的可能——“当现代科学愿意承认自己的无知,就让它比所有先前的知识体系更具活力、更有弹性,也更有求知欲”[44]。如果人们试图从生成式人工智能在其他领域表现出的应用潜力,以推测其可能的教育效用,这不仅混淆了教育与其他领域的不同,也容易犯下张冠李戴似的谬误。更糟的是,这样的动机归因难免让教育被其他领域的利益和目标所定义[45]。鉴于此,探究用生成式人工智能的教育效用不能简单参照它在其他领域的表现及其诉求,而应先从“深度学习”的角度想清楚它善于解决什么问题,以便“教育”想明白它需要用深度学习解决什么问题。首先,触发深度学习这类算法变革的根本原因之一便是人类社会对复杂性有了更高的需求[46]。也可以说,因为有了深度学习,人们方才有机会弄明白比之前复杂得多的教育现象。同时,算法运用大数据意味着被分析的数据拥有庞大体量和高度复杂性,这只会令问题变得更加复杂[47]。而为了应对这样的复杂,人们必须依靠深度学习这样更复杂的算法[48]。由此可知,如果教育仅仅试图解决简单问题,则没有必要诉诸深度学习。其次,教育作为一种日益复杂的存在,无论是它的问题还是答案都日益依赖人们对这个复杂多变、充满联结又远超人类所能理解世界的深刻阐释。对此,用富兰的话来表示便是,“解决今天的教育问题是一件复杂的事情;它像一门火箭科学”[49]。由此可见,既然如今的教育已经是如此的不简单,那么它也没有理由从深度学习中寻求简单的答案。上述两点可以表明,那些真正需要诉诸深度学习予以解决的教育问题必然是一些复杂问题。不过,这也引申出了另外一个问题:什么样的复杂问题才能在深度学习中被解决?要知道,当前教育中那些令人头疼的问题往往都是一些因为条件不完整、相互矛盾、经常变化且不易确认而难以或无法解决的抗解问题[50]。而图灵意义上的人工智能不但可计算,而且必须算出结果。所以,对于“抗解问题”这类不可计算的命题,深度学习也给不出答案,反而可能如其局限所示,沦为人们自我欺骗的思想悲剧。有鉴于此,与将深度学习浪费在不可解的教育问题上相比,立足复杂且可解更有必要构成教育的应用前提。历史地看,从邱奇-图灵论题第一次从逻辑上建立起算力与价值的关联开始,算力便成为了解决种种计算问题的关键所在,不过受制于算力局限与不可计算函数的存在,科学家们逐渐将精力转向研究“计算机在多长时间和多大空间内,才能计算出一个有意义的结论”,从而发展出计算复杂性理论[51]。自此,可以在空间上更好发挥算力优势的深度学习方才能引领生成式人工智能的爆发。以之为鉴,人们在探究生成式人工智能是否可用于教育之前,有必要考虑以下两个前提。(1)教育的可计算,即深度学习究竟可以在多大范围计算出有意义的教育结果。也可以说,正因为深度学习不可能穷尽教育的所有答案,为它寻求“更好用途”方才显得有意义;正因为深度学习无法用于那些无从判断和检验的教育问题,所以要优先考虑那些能够清晰描述且理解起来无歧义、拥有明确判定标准和程序的问题。(2)教育的复杂性计算,即哪些教育问题需要诉诸深度学习“用能源换时间”的算力优势。比如,什么样的问题值得教育投入大量的算力资源,把原本需要10年来完成的事情,压缩到1年时间;什么样的问题值得教育投入更大的算力资源,以便将决策时间提前;什么样的问题需要诉诸算法决策、大模型和智能机器,以实现比人更高的效益和更低的成本;或者说,让人类教育体系借助深度学习拥有如同“可控核聚变”与“天气预报”一般的稳定性与可预测性,这一切是否值得。一旦教育中人开始思考这类问题,那些看似有理实则无解或者入不敷出、纯粹重复或浪费资源的问题解决方案不仅会得到祛魅,一些真正值得诉诸生成式人工智能的教育应用也将得以涌现。如前所述,既然深度学习存在这样无从克服的谬误,那么,人们凭什么相信基于生成式人工智能的教育具有无与伦比的优越性与先进性?无论生成式人工智能在当下表现出多么令人赞叹的实力和潜力,人们都有理由怀疑,与其他算法相比,或者与其他人工智能相比,深度学习凭什么导向更好的教育?那些凿凿之言究竟是技术的想象,还是不知所云的幻想?在人们亲身经历这一切之前,所有的回答都只是猜想。要知道,凯文·凯利在《科技想要什么》已经用事实和数据表明,“我们这个时代不是第一个放大了技术所承诺的好处的时代”[52]。列举上述观点既无意、也无法证明,深度学习无法导向更好的教育。但这确实意味着,人们有必要清醒的追问,面对扑面而来的生成式人工智能浪潮,如果教育中人仅仅按照“已经理解”的美好去谈论和设计与之有关的未来,是否会沉耽于经验的片面、习惯的重复和表面的繁荣?或者像当年义无反顾地拥抱计算机与互联网那般,争先恐后地拥抱种种人工智能,然后在解决问题的同时,留下更多说不清、道不明的难题?这些问题不仅人类给不出答案,深度学习也不行。就像“图灵停机问题”所表明的那般[53],正因为算法不能完全解释它所建模的事物,即便所有教育问题都可以用算法进行描述,这样的人工智能也解决不了所有问题。所以,人们只能慢慢看着教育是否会因为深度学习而变得更好,而不能借助深度学习以窥见“未来”或“结果”;并且,世界上有些教育问题,人们只能看着它发生,而无法解释它为什么会发生,即便诉诸深度学习也是如此。由此,教育中人亦能理解现代人工智能的另一层涵义,即“当不确定性最终成为世界决策中的一个普遍问题时发生的革命”[54]。在此意义上,无论是深度学习驱动的教育变革,还是其他算法和人工智能驱动的教育变革,它们都意味着“不确定事件”。这样的结果或许会破坏人们对生成式人工智能的某些共识,或许会令那些笃定生成式人工智能之人感到愤怒或沮丧,或许让那些围绕生成式人工智能开展的实践陷入迷茫。但与假装确定或者无视不确定相比,将生成式人工智能视作教育“唯一方向”“唯一引擎”“唯一赛道”不仅危害更大,也将使得那些不同于生成式人工智能的教育被忽视和中断,更可能延误那些于国、于人、于教育更为有利的算法创新。概言之,与因为不确定而损失的舒适感、熟悉感和控制感相比,那些因为不确定而涌现的自由、创新和多元更能确保教育的美好未来。因此之故,“何以确定深度学习导向更好的教育”的更好回答是,人们可以不相信深度学习一定导向更好的教育,但一定要相信深度学习之于教育仍有太多未知、复杂、不确定以及由此形成的精彩之处需要有心之人去探索、去经历和去发现。在这个意义上,真正令人确信深度学习一定导向更好教育的原因,一定不是深度学习本身,而是那些凝结在深度学习上的人类探索、经历及其发现。综上所述,本文对生成式人工智能何以构成教育奇点的探讨,与其说是想证明或证否生成式人工智能是否可以彻底改变教育,或者能否将教育置于某种前所未有的美好境地,不如说是想从前提上对生成式人工智能作出澄清,以警醒那种仅仅着眼于一种选项、一隅之见、一事得失、一时表象的视角固着、知识残缺与急促心态。这对热衷于关注奇点是否会来的教育而言,或许不足以构成可谓确切的答案,但却足以引申出深度理解之于教育的重要性和必要性。进一步而言,生成式人工智能之所以需要被深度理解,一方面是因为已经有研究者指出,“总体来看,人工智能有可能走错了路,目前的大量工作都致力于没有那么智能的机器,这些机器主要依赖统计预测和大数据,而不是我们所说的深度理解。我们认为这是一个巨大的错误,因为这导致了某种形式的人工智能青春期,机器不清楚自身的力量,也没有能力去考虑自己行为的后果”[55]。并且,“现阶段深度学习的最大价值并不在于它可以从数据中学到什么,而是透过它,人类学会了什么”[56]。换言之,正如图灵的理解孕育了基于图灵机的智能革命,同理,也只有当人们深度理解了生成式人工智能,诸如图灵革命这样的奇点才有可能在教育中诞生。另一方面则是出于奇点研究的深层期待。就像奇点的著名支持者库兹韦尔所言,“我们所预测的技术持续进步和社会反响都是基于以往的经验。但事实上,未来发展将远超大多数人的认识”[57]。这也反过来表明,与简单关注(或者争论)奇点是否临近相比,深度理解生成式人工智能究竟会给教育带来怎样的变化,或许才是探讨奇点的教育价值所在。除此之外,“深度学习”一词的诞生更是蕴含了对深度理解的期许。“深度学习从原理上看就是多层神经网络,但是辛顿提出这个词,意在激励研究者们在一个失宠的领域坚持自己的正确信念。深度学习这个概念在接下来的10年里大获成功”[58]。与之相比,人工智能一词的提出者麦卡锡却失望的表示,“人工智能这个词被发明之后,该术语并未对研究工作发挥应有的作用”[59]。甚至于到了当下,人工智能之于教育的作用不仅没有如期得到体现,反而衍生了诸多像魔法一般的幻觉[60]。归根究底,教育中人不仅对人工智能抱有诸多不切实际的期待,更有太多浮于表面、囿于一隅、急于求成、耽于美好的理解。这既是始于深度学习的生成式人工智能可能在教育中被辜负的理由,也是在教育对生成式人工智能的探讨何以从深度学习迈向深度理解的缘由。因此之故,与探讨生成式人工智能何以构成教育奇点相比,教育中人更有必要抚躬自问,他们是否能跨领域、长时间、多层次、辩证性地深度理解生成式人工智能。(1)跨领域意味着,无论是数学、物理、生物学、计算机科学,还是政治、历史、社会、心理学和教育,它们都能为生成式人工智能提供自己的见解和证据,且不能相互替代。所以,就算数学和物理能为“智能”提供坚实的支撑,但这替代不了政治和历史对于“人性”的洞见。更何况,智能是“顺流而下”地助涨人性下坠(贪婪、恐惧、懈怠),还是“迎难而上”地引领人性上升(自觉、勇敢、奋发)这类与物无关却于人有根本意义的问题,它们无法在“智能”意义上被设计,而需要在人性中获得理解。(2)长时间意味着,理解生成式人工智能,除了看当下的流行与趋势、赞美与热情、创新与潜力,还应将视野拉升到过去的风光与失落、经验与教训、起源与演化,以及未来的无知与求知、复杂与多元、不确定与自由。也只有在更长的时间范围,当教育中人发现算力、数据、模型等令人激动的新词汇并不能解决所有教育问题,一场人造的繁荣局面回归于真实的平淡之后,他们方才能看清生成式人工智能“是与非”的本质、“能与否”的边界、“好与坏”的价值。(3)多层次意味着,理解生成式人工智能,除了需要理解它的实现与应用,更要理解它的原理与影响。因为与当前教育中人对实现与应用的巨大关注相比,原理和影响显然是个短板。a.对于原理,人们需要清醒认识到的是,如果某种应用在原理上被允许和限制,那么后续的结果非但不难被预料,更难以被改变;反言之,如果人们总是在教育的“下游”发现种种应用的问题,却不思考“上游”出了什么问题,那么它的所有改进都难免陷入被动和徒劳。所以,“它是什么”“它的成立前提是什么”“它的运行规则是什么”有必要在教育中得到关注。b.对于影响,人们有必要追问,生成式人工智能的发展如此之快,快到人们缺乏相应的知识和智识去解读它们,人们应该怎么办?如果人们轻率地创造了一个连自己都搞不明白的未来,人们应该如何与之相处?又该如何告诉后人?有没有可能当生成式人工智能铺满校园后,人们才发现自己既不确定自己需不需要它,或者没有它也有更好的教育选择?这并非危言耸听。因为“科林格里奇”已经表明,“一项技术的社会后果不能在技术生命的早期被预料到。然而,当不希望的后果被发现时,技术却往往已经成为整个经济和社会结构的一部分,以至于对它的控制将会变得非常昂贵、困难和费时”[61]。所以,无论基于生成式人工智能的教育实现及其应用多么激动人心且卓有成效,它所构成的教育影响都有必要得到审视,以便人们在思想和规则上做好准备。(4)辩证性意味着,除了要关注与生成式人工智能的支持、机遇、成功、得到、建设、助力以及由此构成的美好,还要留心那些与之相伴而生的反对、挑战、失败、遗失、破坏、阻力以及由此构成的苦涩;除了看到生成式人工智能可能加速的满足、期望和成效,也要想到那些可能被加速的不满、失落与谬误;除了要强调那些需要诉诸生成式人工智能以获得根本扭转的短板与不足,也要捍卫某些不想被爆炸式改变的人类基本价值,以便不偏不倚地开出生成式人工智能之于人类的得失清单和利弊说明,清醒地抛弃那些曾经不知不觉的浮夸、偏狭、轻信和自欺。由此出发,辛顿在长期不被主流学术圈认可的情况下坚持深度学习,然后却在ChatGPT大获成功后对其感到怀疑和忧虑,才能得到恰当解释;无论生成式人工智能是否足以改变世界,仍有后来者坚持探索其他可能,或者在其虎头蛇尾之后仍有人坚持这个方向,才能从罗森布拉特开始被讲述一个逻辑自洽且生动精彩的教育故事;那些无法用于预测奇点是否来临,却关系到奇点能否来临的世代传承、求知乐趣与自发信念方才能在教育中得以释放。所以,无论生成式人工智能是否构成教育奇点,它都值得被教育中人深度理解。承前所述,教育中人若是可以跨领域、长时间、多层次地辩证理解生成式人工智能之于教育的未知、复杂与不确定,而不是将之视作某种必然的简单事实,那么,无论当下之人是否有幸见证始于生成式人工智能的教育奇点,这样的深度理解都能通过加深教育对概念、问题和目的的理解,以引申出奇点临近的可能。其一,立足深度概念。ChatGPT的全球爆红使得不少人觉得在自己无法确切了解的地方发生了一件很重要的事,但又无法确切知道它是什么。这样的朦胧与巨大冲击反而唤起了人们的好奇与热情。而这不禁使人怀疑,生成式人工智能之所以在当下有如此巨大的影响力,其中很大一部分原因便是人们不知道它究竟是什么。事实上,如果人们对生成式人工智能的探究能够立足于一些更具深度的概念,比如“图灵机”“控制论”“命题逻辑”“神经突触理论”,等等。那么,他们便不难理解,“ChatGPT其实是基于重大工程的技术创新,它既非科学发现,也没有什么新理论,而是组合了多种技术,融入了一些巧妙的想法,最终解决了一个过去没有解决的重大问题”[62]。而它真正具有科学价值的部分,仅仅是突破图机灵架构的可能;而它在数学层面的突破则几乎为零;不过,它的技术创新与工程意义显然是巨大的;倘若因此,学校只讲技术与工程,那些在数学与科学上真正值得研究和突破的难题又如何说起了?总之,教育中人对生成式人工智能的探讨能否深入其理,不仅决定了生成式人工智能的教育幻觉及其谬误能否从源头上得到祛魅,也决定了教育中人能否站在离人工智能更近的位置理解当前发生的一切。其二,提出深度问题。无论是深度学习的局限,还是那些始于深度学习的未经定义之处,它们都能表明,与将生成式人工智能视作教育的答案相比,将之视作更好问题的来源或许更为恰当。也可以说,生成式人工智能决定了什么样的教育问题有待解决。现如今,诸如深度学习这样的机器学习算法可以依托数据的自我训练、自我学习过程完成参数调整与模型构建,进而表达出超乎人类所知的内容[63]。这不仅推翻了西方文明“只有人类才能探知宇宙真理”的基本共识[64],更衍生出了以下仍无判断却事关人类知识本质的问题:面对以ChatGPT为代表的人工智能,什么样的知识仍必须由人来进行生产/传播?什么样的知识生产/传播需要由人与人工智能来合作完成?什么样的知识生产/传播可以委托给人工智能?诸如此类问题不仅值得被教育中人深度理解,更指向了教育奇点的真正意义。其三,解蔽深度目的。如果应用构成了生成式人工智能之于教育的全部目的,那么今天教育中人因为它有用(好用)而支持它,明天就可能因为它没用(不好用)而反对它。与此同时,仅仅关注应用也解释不了,“即便知道可用也不用”的教育品格。所以,与关注生成式人工智能究竟能在教育中做到什么相比,教育中人更有必要关心师生究竟可以从中知道什么,以开展有求知意义的育人活动。首先,只有在这样的目的之下,人们在生成式人工智能“已经知道”和“需要知道”之间的差异及其谬误,才会被视作一个亟待解决的求知问题与育人问题。其次,只有在这样的目的之下,教育中人才能把生成式人工智能安放在更为恰当的求知之位与育人之位,而不是被其误导、蒙蔽或裹挟。反言之,如果教育不反思生成式人工智能的求知意义与育人价值,那么相关探讨不仅偏离了教育的本质,更可能助涨生成式人工智能的误解和滥用。再者,只有在这样的目的之下,人们才会从“有求知意义的育人活动”的视角,去检验生成式人工智能的合理性、必要性和正当性,而不是在生成式人工智能浪潮中随便选择某个产品将其应用于教育,然后发现这样的应用非但无益于育人且没有什么求知价值。最后,也只有在这样的目的之下,“奇点人”才能因为求知和育人上升为比“奇点”更加值得关注的教育议题。与当前教育中人对奇点的熟知相比,“奇点人”这个更重要甚至离教育更近的兼具求知价值和育人内涵的概念却鲜有人知。如今之人往往将库兹韦尔的《奇点临近》一书视为“探讨奇点的科技著作”,却不曾看到,库兹韦尔在介绍完他心中的奇点含义之后,马上写道“一个人真正理解奇点的含义,将从根本上改变他的人生观和他的人生。我将那些理解奇点并在生活中履行奇点价值观的人视为奇点人”[65]。从库兹韦尔的观点不难看出,奇点人比奇点重要,正如图灵比图灵机重要。这种重要性体现为,只有当可以深度理解某个技术的奇点人出现时,奇点才会降临。历史也已表明,当图灵用自己理解的人工智能来表达它时,人工智能确实迎来了自己的奇点。一旦明白这一点,“有求知意义的育人活动”的重要性自然也将跃升于生成式人工智能之上。毕竟,与可能构成奇点的生成式人工智能相比,有益于涌现奇点人的教育更值得被关注。历史地看,智能教学系统早在20世纪60年代得到了承认,但它至今仍未给教育带来革命,其中的重要原因便是,教育中人理解不了这样的智能教学系统[66]。类似地,无论今日之人如何强调深度学习的优越性和先进性,亦或因之设计出怎样的智能应用,若是它们超出了教育中人的理解范畴,它们所带给教育的影响不仅会变得极为有限,更有可能因此变得未知、复杂且不确定。也正鉴于此,教育若想藉由生成式人工智能拥抱亦真亦幻的奇点,并因此而受益,它就绝不能止步于欣赏和使用种种人工智能,而应深度理解人工智能的本质、突破与局限。这既是本文追问生成式人工智能何以构成教育奇点的逻辑遵循,也是从深度学习到深度理解为何需要在教育尺度上被关注和讨论的根本缘由。[1][3][7][10][57][65] [美]库兹韦尔.董振华,李庆诚译.奇点临近[M].北京:机械工业出版社,2011.[2] 何怀宏.奇点临近:福音还是噩耗——人工智能可能带来的最大挑战[J].探索与争鸣,2018,(11):50-59+117.[4] 朱彦明.奇点理论:技术“复魅”世界?——批判地阅读库兹韦尔的《奇点临近》[J].科学技术哲学研究,2020,(6):83-88.[5] 万赟.从图灵测试到深度学习:人工智能60年[J].科技导报,2016,(7):26-33.[6] [英]默里·沙纳汉.霍斯亮译.技术奇点[M].北京:中信出版社,2016.[8][16][19][46][56] [美]佩德罗·多明戈斯.黄芳萍译.终极算法——机器学习和人工智能如何重塑世界[M].北京:中信出版社,2017.[9] 杨欣.教育数字化转型的算法机遇、挑战与调适[J].高等教育研究,2022,(2):13-22.[11][12][17][28] [美]特伦斯·谢诺夫斯基.姜悦兵译.深度学习:智能时代的核心驱动力量[M].北京:中信出版社,2019.[13][14] [美]凯德·梅茨.桂曙光译.深度学习革命[M].北京:中信出版社,2023.[15] 尹宝才,王文通等.深度学习研究综述[J].北京工业大学学报,2015,(1):48-59.[18][55] [美]盖瑞·马库斯,[美]欧内斯特·戴维斯.龙志勇译.如何创造可信的AI[M].杭州:浙江教育出版社,2020.[20] 侯宇青阳,全吉成等.深度学习发展综述[J].舰船电子工程,2017,(4):5-9+111.[21] [英]凯伦·杨,[英]马丁·洛奇.林少伟,唐林垚译.驯服算法:数字歧视与算法规制[M].上海:上海人民出版社,2020.[22][23][25][27][48][51][58][62] 吴翰清.计算[M].北京:电子工业出版社,2023.[24] 王吉伟.AI Agent发展简史,从哲学思想启蒙到人工智能实体落地[J].大数据时代,2023,(12):6-19.[26] [美]蒂姆·奥莱利.杨晨曦,戴茗玥等译.未来地图:技术、商业和我们的选择[M].北京:电子工业出版社,2018.[29] Binns R.Algorithmic accountability and public reason [J].Philosophy & Technology,2018,(1):543-556.[30] 杨欣.教育数字化转型中的算法权力及其规制[J].华东师范大学学报(教育科学版),2024,(1):114-126.[31] 杨欣.教育评价改革的算法追问[J].华东师范大学学报(教育科学版),2022,(1):19-29.[32] 钱力,刘熠等.ChatGPT的技术基础分析[J].数据分析与知识发现,2023,(3):6-15.[33] 曹培杰,谢阳斌等.教育大模型的发展现状、创新架构及应用展望[J].现代教育技术,2024,34(2):5-12.[34] 卢宇,余京蕾等.多模态大模型的教育应用研究与展望[J].电化教育研究,2023,(6):38-44.[35] 罗江华,张玉柳.多模态大模型驱动的学科知识图谱进化及教育应用[J].现代教育技术,2023,(12):76-88.[36] 戴琼海.大模型技术:变革、挑战与机遇[J].中国科学基金,2023,(5):713.[37] 贾积有,张誉月.人工智能与教育:机遇、挑战与对策[J].北京大学教育评论,2023,(1):49-61+188-189.[38] 公雪,刘秉新等.两足教育机器人的历史发微与设计逻辑[J].现代远距离教育,2023,(4):41-52.[39][40] [澳]艾伦·查尔默斯.蒋劲松译.科学及其编造[M].上海:上海科技教育出版社,2007.[41] [意]卢西亚诺·弗洛里迪.王文革译.第四次革命:人工智能如何重塑人类现实[M].杭州:浙江人民出版社,2016.[42][63][64] [美]戴维·温伯格.刘丽艳译.混沌:技术、复杂性和互联网的未来[M].北京:中信出版社,2022.[43] [美]纳特·西尔弗.胡晓姣,张新等译.信号与噪声[M].北京:中信出版社,2013.[44] [以]尤瓦尔·赫拉利.林俊宏译.人类简史:从动物到上帝[M].北京:中信出版社,2017.[45] 杨欣.未知的精彩冒险——教育数字化转型的图景透视[J].教育学报,2024,(3):59-71.[47] [意]亚历山德罗·韦斯皮尼亚尼,[意]罗西塔·里塔诺.潘源文译.算法与预言:复杂科学如何预测和改变未来[M].北京:中信出版社,2023.[49] [加]迈克尔·富兰.赵中建,陈霞等译.教育变革新意义[M].北京:教育科学出版社,2005.[50] 杨欣.教育治理数字化转型的利弊及其调适[J].中国电化教育,2022,(11):45-52.[52] [美]凯文·凯利.严丽娟译.科技想要什么[M].北京:电子工业出版社,2023.[53] [美]爱德华·阿什福德·李.张凯龙,冯红译.柏拉图与技术呆子:人类与技术的创造性伙伴关系[M].北京:中信出版社,2020.[54][66] [美]斯图尔特·罗素.张羿译.AI新生:破解人机共存密码——人类最后一个大问题[M].北京:中信出版社,2020.[59] [荷]彼得·阿德里安斯,[荷]约翰·范·本瑟姆.殷杰,原志宏等译.信息哲学[M].北京:北京师范大学出版社,2015.[60] 杨欣.魔法与科学:人工智能的教育迷思及其祛魅[J].教育学报,2021,(2):18-31.[61] Collingridge D.the Social Control of Technology [M].Milton Keynes:Open University Press,1980.