点击蓝字,关注我们
技术扩散基础上的整体性对齐:
大模型的开源与闭源之争
推荐理由
开源与闭源之争是人工智能大模型领域的核心争论之一。开源模式以其开放、协作的特性,激发了无数开发者的创造力,推动了大模型技术的快速迭代与普及。而闭源模式则以其商业化、专业化的优势,确保了大模型技术的深度开发和安全性。本文认为,开源与闭源这两种截然不同的开发模式看似针锋相对,实际上则是相互依存和促进。同时,针对开源大模型可能造成的种种问题,本文提出推动大模型的整体性对齐来作为应对之策。
作者:高奇琦1, 2,张皓淼2
(1. 华东政法大学 政府管理学院;
2. 华东政法大学 政治学研究院,上海 201620)
高奇琦
张皓淼
摘要:大模型的开闭源是目前的一个重要的争论点,这种争论主要集中在效率问题、安全问题以及平等化与民主化问题上。促使大模型开源的动力主要有开源大模型在市场上的独特优势所带来的经济利益和带有一定理想主义色彩的开发者对技术平等和技术民主的追求。大模型开源亦面临一些挑战,包括经济效益挑战、社会加速挑战和社会安全挑战。后两种挑战需要人类社会进行应对,这包括两种方式,一是通过适当的闭源来缓冲技术扩散的速度,二是通过对齐技术来使大模型受到人类社会规则的约束。大模型对齐应当是整体性的,其包括阶梯性的对齐、人与大模型的双重对齐和大模型生产全过程对齐三个基本方面,而其实现机制包括透明性机制和协商机制两大机制。
关键词:大模型;开源;技术扩散;整体性对齐;GPT
大模型的发展经历了从无条件开源到开闭源并存的过程。当前,开源与闭源已成为大模型发展的核心争论之一。笔者认为,大模型的开源与闭源代表着两种不同的发展模式,并各自具有不同的动力和优势。闭源是一种较为传统的发展模式,且在现今的市场中占据主导地位。而开源是一种理想主义和现实主义兼具的行为,其本质是一种技术扩散,但在这一过程中也会造成一些负面影响。为了深入探讨这一问题,笔者将引入以保罗·维利里奥(Paul Virilio)为代表的速度学理论和以京特·安德斯(Gunther Anders)为代表的技术批判理论来对大模型开源造成的社会问题进行讨论。笔者认为,对齐是解决这些问题的重要途径,文章最后提出了整体性对齐这一概念,并讨论其内涵和实现机制。
01
大模型开闭源的关键争论
计算机软件的源代码是指软件开发者所创造的原始代码,其需要通过编译过程转化为可以被计算机识别的语言。而开源(Open Source)全称为开放源代码,指将源代码公开发布并允许任何人查看、修改和使用的行为。与开源软件相对的是闭源软件,即不公开源代码,只对外发布编译后语言的软件。在早期计算机市场,软件源代码是随硬件无偿提供的。用户购买硬件的同时,软件已经被预装在其上,并且源代码是完全公开的。随着计算机行业的发展,出现了专门的软件供应商,由于软件源代码的可复制性,供应商必然会选择封闭源代码从而防止其产品被轻易复制,于是,闭源软件由此诞生。[1]与此同时,以理查德·斯托曼(Richard Stallman)为代表的一部分主张软件自由的开发者仍然坚持开放源代码,从而发起了所谓“自由软件运动”(Free Software Movement),这标志着开源作为一种社会运动的兴起。[2]
大语言模型(Large Language Model,LLM)简称大模型,是指经过大量文本训练,拥有复杂结构和参数的深度学习模型。大模型技术是近年来最令人瞩目的技术进展。被誉为“AI教父”的杰弗里·辛顿(Geoffrey Hinton)认为,大模型已经成为一种“超级智能体”,其智力水平完全凌驾于人类之上。[3]1而随着大模型技术的进步,其完全有可能发展成为通用人工智能(Artificial General Intelligence,AGI)。DeepMind的首席执行官迪米斯·哈萨比斯(Demis Hassabis)认为,就大模型目前的发展速度而言,人类在近年内就可能看到通用人工智能的出现。[4]一旦大模型发展成为通用人工智能,其就会作为一种核心技术从而引发下一次工业革命。但是,这种技术的巨大进步也会对人类社会产生强烈的“创造性破坏”效应,其将作为一种引擎对人类生产生活各方面产生强大的推力,从而极大地提高生产力水平,同时对原有的人类社会结构产生巨大冲击。这种冲击可能会造成一些负面后果,甚至是对整个人类而言的巨大灾难。
大模型的开源与否对这种社会冲击有着重要的影响。在大模型技术的发展早期,诸如Transformer、BERT、GPT-1.0等初始大模型均是开源的。而随着大模型的逐渐发展,闭源大模型出现,其与开源大模型展开竞争且逐渐占据主流。当前大模型领域的头部产品,如OpenAI的GPT-4、Anthropic的Claude 2、谷歌的PaLM,百度的文心一言均选择了闭源。但同时,仍然有Meta AI的Llama 2、Stable Diffusion的Stable Diffusion XL(SDXL)、阿联酋阿布扎比技术创新研究所的Falcon系列等优秀的开源大模型不断涌现。就目前而言,开源与闭源之争的结果仍然是不明朗的。整体来看,大模型是否开源这一争论将会是一项十分关键的议程,其结果将极大地影响人类社会的未来走向。目前,对于大模型开源和闭源之间的争论主要集中在以下几个方面。
首先是效率问题。在闭源大模型占据主流的当下,开源大模型能否倚仗开源的独特优势从而提高自身能力和市场效率?换言之,开源大模型能否对闭源大模型形成足够的挑战性,甚至重回主流?根据媒体报道,在大语言模型领域,最强的开源模型Llama 2在性能上仍与最强的闭源模型GPT-4有一定的差距。[5]而在文生图模型领域,最强的开源模型SDXL虽然在性能上与最强的闭源模型Midjourney较为接近,但在适用场景的范围上仍然较后者略窄。[6]由于开源大模型与闭源大模型的营利方式不同,开源大模型的开发者是否能够获得足够的经济回报以对其进行优化和改进,是开源大模型能否战胜闭源大模型的关键所在。
其次是安全问题。开源的本质是一种技术扩散,并且是所有扩散形式中最为迅速的。得益于互联网的发展和普及,开源可以将大模型技术以光速传递给拥有网络访问能力的所有人类用户。但是,大模型技术本身以及这种高速扩散在整体上对人类的影响仍旧是未知的。大模型目前已经表露出某种负外部效应,具体可以被总结为失业、失序和失控。[7]而一旦大模型技术的迅速发展导致这种危害急剧膨胀,开源便会将这种危害迅速扩散至整个人类社会。
最后是平等化与民主化问题。这个问题的核心在于,开源作为技术扩散是否能够推动技术平等与技术民主,从而进一步促进社会平等与社会民主。在人类社会的“中心—边缘”格局中,率先实现技术发展的必然是中心地区,故技术发展的早期一定会加剧技术的不平等。而在技术发展的后期将会出现技术扩散,使得技术分配格局趋于平等。但是,大模型的开源却打破了这种技术发展和分配逻辑。通过开源,大模型技术在发展早期即实现了技术扩散,促进了技术平等,而这种技术平等又会进一步作用于社会平等。同时,开源具有大众参与的特征,这决定了开源大模型将会反映大众化和多元化的价值观,同时体现了一种生产过程和结果的民主化。
02
平等理想与现实利益:
大模型开源的核心动力
大模型开源是开源运动在大模型领域的一种体现。开源本身就发端于斯托曼等理想主义者所发动的自由软件运动,而大模型的开源仍然有这种理想主义的动因。以大模型领域的领头羊OpenAI为例,在OpenAI的初创时期,其确实表现出一种理想主义色彩。在OpenAI的第一篇博客中,其声称OpenAI的“目标是为所有人而不是股东创造价值”,因此“专利(如果有的话)将与全世界共享”。[8]OpenAI的首席执行官山姆·阿尔特曼(Sam Altman)也曾在一次采访中提出人们必定会选择开源模型,并保证OpenAI将继续进行开源。[9]这就表达了一种平等化与民主化的思想,主要体现在如下几个方面。
首先,大模型的开源相当于一种技术的再分配。大模型技术的构成代码往往掌握在谷歌、微软等发达国家的科技巨头手中,而通过开源,发展中国家和发达国家的中小型企业也可以近距离接触这些代码,从而通过阅读和学习代码的方式提升自身的技术能力。在这里,笔者拟提出代码解释学的概念。解释学的目的在于通过对文本进行解释,从而获得对文本的某种理解。这种解释是阅读者和文本之间的交互作用。大模型最终是由代码组成的,而代码就表现为一种文本。汉斯·伽达默尔认为,对文本的解释和理解是获得真理不可替代的路径。[10]在保罗·利科对解释主义的讨论中,解释是赋予作为符号的文本以意义的手段,解释者通过“解释”这种能动行为将自身的背景与文本融合起来。开源大模型的代码自从公开的那一刻起,就可以被任何人阅读和学习。这种阅读和学习的过程就是对大模型代码的解释和理解,其意味着要将这些代码包含的技术思想内化到自身的知识和能力结构当中,这就是对文本的一种“占有”(Appropriation)。[11]在这一过程中,访问者能够获得一种如利科所言的意向活动的“意向性意义”(Intentional Sense)。[12]换言之,访问者通过阅读开源代码掌握编写者的意图,并通过学习和理解这种意图来提升自身能力。
其次,开源还可以避免“重复发明轮子”的问题。[13]如果一个技术难题已经被一种开源算法解决,那么后来者再遇到这个问题时就可以直接利用这种解决办法。如果一种算法是闭源的或专利性质的,那么其他人在遇到这一问题时,如果不选择为这一方法付费,就必须研究新的方法。这就意味着从零开始或者规避已有的解决方法,而这一过程就可能带来社会层面上的资源浪费。并且,如果被独占的算法是一种最优解,那么规避这一算法的解决方法的效率就不是最优的。从这种意义上来看,开源能够破解“囚徒困境”,实现社会意义上的效率优化。
最后,开源大模型开发过程的民主化决定了其生成内容的民主化。开源大模型的开发和改进具有一种民主的特征,这是由于其并非全程由固定的个人或组织负责的,而是一种大众参与的开放型项目。每个人在遵守一定规则的前提下,都可以进行开源大模型的开发工作。这种生产过程是一种全人类意义上的社会化大生产,其在某种程度上类似于马克思所描绘的“自由人联合体”。①这种民主的生产过程使得开源大模型本身输入和输出的内容都带有一定程度的民主色彩。罗伯特·达尔(Robert Dahl)极为重视参与的价值,并将参与视为民主的一个基本要素。参与既是评判民主的标准,也是导致民主的原因,只有通过参与,公民才能表达自身的价值和需求。[14]由于存在这种广泛参与的、多元化的公众输入,开源大模型的内容较闭源大模型而言能够更加符合大众的价值观。OpenAssistant的发布就体现了这一目的。OpenAssistant是一个对标ChatGPT的开源大语言模型,其旨在实现大模型民主化。与ChatGPT不同的是,OpenAssistant的语料库是全球各地超过13500名志愿者所共同完成的。[15]这就使得OpenAssistant能够代表更为广泛的价值观,其生成内容具有更多民主特征。
但是,大模型的开源并不能被简单理解为一种自发性的共享行为。尽管开源最初确实是作为一种反市场的运动存在的,然而,之所以开源可以在市场经济下得以生存和发展,仍然是由于其顺应了市场经济的基本逻辑,从而在市场中获得了某种作为正向激励的经济动力。这种经济动力主要有以下几种。
其一,开源大模型的开发者虽然不能通过出售大模型的使用权获取经济利益,但可以售卖与开源大模型相关或捆绑的软件和服务。互联网技术问答网站Stack Overflow的创始人乔尔·斯波斯基(Joel Spolsky)在其个人博客中写道,互联网公司开发的开源软件一般都是其所要售卖的软件或服务的互补品,而互补品需求的增加必然导致其所售卖软件或服务的销量增加。[16]在大模型领域,这种互补品主要是开源大模型的拓展化和定制化服务。被开源的大模型往往是较为原始的基础版本,而如果想要获得进一步的功能,就需要付费的拓展性服务,这些拓展服务主要包括应用程序接口(Application Program Interface,API)、数据托管和AI解决方案服务等。譬如,Hugging Face就开发了包括AutoTrain、Inference API & Infinity、Private Hub、Expert Support等服务。通过这些服务,Hugging Face自2021年以来持续处于正现金流状态。[17]
其二,开源可以被当作一种“价格战”手段,其可以抢占市场、设立标准。譬如,安卓(Android)就是谷歌研发的基于Linux内核的开源移动操作系统,其诞生目的是为了对抗当时占据市场主流的苹果公司的iOS系统。由于安卓采取了开源,所以很快在大多数非苹果公司的手机和其他移动设备上得到采用,其市场份额迅速超过iOS。[18]在大模型领域,谷歌仍然采取了这一战略。自从2017年谷歌提出并开源了Transformer架构后,基于Transformer的模型便如雨后春笋般涌现。目前,市场上几乎所有人工智能大模型,如GPT、Midjourney、Stable Diffusion、GitHub Copilo都采用了Transformer架构。[19]可以说,谷歌在很大程度上设定了大模型市场的底层标准。
其三,大模型的开源开发可以发挥规模效应。开源技术是一种打破传统的存在,这主要体现在其允许社会大众的广泛参与。如果一个开源大模型有足够多的人参与,那么其就能够以极快的速度得到发展。并且,在开源界还流传着著名的“林纳斯法则”(Linus’ Law),即开源软件的代码被所有访问者共同审查,这将会较为容易地发现其中的漏洞。[20]以Stable Diffusion发布的开源文生图模型SDXL为例,由于其拥有一个开源社区,用户可以不断通过社区产出针对性的插件和微调。[21]譬如,SDXL在处理手部图像时存在一定的缺陷,但是社区用户在几周之内通过补丁解决了这一问题。并且,开源的SDXL还可以与ControlNet 技术相结合,从而生成具有特色的图片。开源为SDXL带来的助力使得其性能可以与市场上的闭源文生图大模型如Midjourney相抗衡,甚至有所超越。
其四,开源大模型可以有效保护数据隐私。闭源大模型是被部署在所属企业的,使用者的输入数据需要通过云端服务的方式被传输给大模型所在的机房。在这一过程中,使用者实际上是与拥有大模型的公司共享了这些数据。据媒体报道,近段时间,韩国三星公司发生了三起在使用ChatGPT时所造成的泄密事件。[22]而开源大模型可以被使用者安装在自己的设备中。对于一些数据保密性要求较高的工作,开源大模型显然更加适用。
① 马克思设想到,“有一个自由人联合体,他们用公共的生产资料进行劳动,并且自觉地把他们许多个人劳动力当作一个社会劳动力来使用”。参见:[德]马克思:《资本论》,中共中央马克思恩格斯列宁斯大林著作编译局译,北京:人民出版社,2004年版,第96页。
03
阻止扩散与安全关切:
大模型闭源的主要考虑
相对于开源,闭源则是一种较为传统,也更具现实主义色彩的发展模式。在笔者看来,大模型闭源的动力主要来自以下几个方面。
第一,大模型闭源的政治经济动力。大模型闭源的最主要经济考虑与其他闭源软件类似,即通过界定产权来获取经济收入。如上所述,大模型的发展经历了一个从早期无条件开源走向如今闭源为主的过程,这种发展历程与马克思所描述的人类历史进程相类似:在大模型诞生早期,其结构和代码处于一种无条件公开分享的状态,类似于原始社会。而随着大模型的发展,闭源大模型出现,这类似于私有制的诞生。并且,许多大模型企业将开源和闭源作为产品不同发展阶段的商业策略,以OpenAI为例,其研发的GPT系列模型的前两代GPT-1和GPT-2都是开源的,而从GPT-3开始便走向闭源。[23]这种做法可能会成为许多同类大模型企业的共同取向,即在企业初创时期,利用开源的种种优势快速打造自身产品,而一旦产品成熟了,便走向闭源并且商业化,从而赚取经济利益。
推动大模型闭源的另一个政治经济动力是出于竞争目的而阻止大模型技术的扩散。OpenAI首席科学家伊利亚·苏茨卡弗(Ilya Sutskever)在谈及为何GPT-4选择闭源时表示,大模型这一领域的竞争日趋激烈,许多公司都试图加入这一赛道,而GPT-4的闭源正是为了应对这种竞争。[24]而在国家层面上,这种竞争仍然存在。开源大模型虽然具有跨国性,但不可能是去国家化的,其必须在国家权力的保护之下,这决定了其必须服从于国家管制。当大模型的源代码被发布在某个网站上时,就会受到这个网站服务器所属国家的权力制约。发生在国际社会中的竞争将不可避免地延伸到开源大模型领域。目前,绝大多数开源网站都为美国所有,那么这些开源网站就可能作为美国在国际竞争中的一种筹码。有媒体认为,在现有世界发展的格局下,美国可能对将开源代码提供给中国这一行为进行一定程度的限制。[25]可以预见的是,随着中国在大模型领域的不断崛起,美国将会寻求手段在开源大模型领域限制中国,而中国也会选择培育自己的开源大模型和开源发布平台来回应这种限制。中国现有开源大模型以清华智谱AI的ChatGLM、智源人工智能研究院的悟道·天鹰(Aquila)以及百川智能的Baichuan系列等为代表;开源发布平台则以开源中国(OSCHINA)旗下的代码托管平台码云(Gitee)为代表。
第二,开源所推动的大模型技术扩散带来的社会加速。大模型是一种超级技术,其非常鲜明地表现为一种加速,这种加速会带来社会生产力的巨大提高。但是,这种加速过程也会使社会遭遇灾难。我们不能简单地认为,技术进步对社会产生的影响会是完全正面的,因为技术的进步最终要与人类社会的发展相结合。如果技术进步的速度过快,而人类社会很难在较短时间内适应这种高速进步,则后者就会产生畸形,这种畸形会导致灾难性的后果。譬如,两次工业革命极大地提高了人类社会的生产效率,但是,这种高速进步也造成了各国政治经济利益分配的极度不平衡,而这种不平衡所带来的则是两次堪称毁灭性的世界大战。
技术的发展和扩散是一个需要一定时间的过程。而开源使得大模型无条件对外公开,这可以被看作是一种对技术扩散的助推,降低甚至取消了社会与大模型技术发生接触的制约门槛,从而大模型会通过开源而迅速扩散至整个社会。这种助推的本质是一种“对加速的加速”。即大模型本身对社会是一种加速,而开源对这种加速过程本身又进行了加速。这种双重加速会将大模型导致的社会变革推向一种不可承受的速度,从而导向奇点。在奇点中,一切都失去控制。经过这种双重加速的大模型技术就如同维利里奥所言的“光速技术”,即当技术到达一定程度后,限制人类思维的不再是技术,而是人类本身的阅读和理解能力。[26]维利里奥实际在强调,技术到达一定程度后,就会突破人类的限制。由于人类的能力不足以制约技术的加速,技术就会如同一列失控的高速列车,将人类社会带入深不见底的深渊。
大模型对社会加速进程的推进是不可逆的。在技术进步的洪流面前,人类实际上是无助的,即处在马丁·海德格尔所言的“被抛境况”。[27]174海德格尔的这一语式表达的思想是,一个物存在于世界的方式是一种被动的、无法选择的状态。人类面对技术的发展洪流时,面对的也是一种无法改变的状态,换言之,人们是被迫卷入技术发展的浪潮之中。但是,人类可以在一定程度上减缓这种加速的进程。开源导致了“对加速的加速”,而闭源可能是一种有效的对抗手段。大模型闭源对大模型的社会普及过程会产生一种缓冲。闭源使得大模型在没有发布时与社会相隔离,从而给社会一定的时间去调整自身以适应大模型带来的冲击。而当这种闭源大模型真正向社会发布时,往往已经是一种较为成熟的形态。
第三,开源大模型可能造成的安全负外部效应和人类总危机。Meta开源了旗下大模型LlaMA系列的权重后,许多自称为“Concerned Citizens”(有关公民)的民众在其旧金山办公室下进行抗议。一些抗议者将开源大模型称为“大规模杀伤性武器”。抗议领导者赫利·艾尔默(Holly Elmore)认为,大模型权重的公开导致任何人都可以复制和修改模型,从而使得大模型可能被用于恶意活动,而随着大模型的不断强大,这种威胁正在急剧上升。[28]这种担心并不是毫无道理的。一项来自MIT、剑桥等机构所组织的黑客马拉松证明,经过微调后的开放权重开源大模型能够帮助使用者以极低的成本获取毁灭性生物病毒的样本信息。[29]然而,这种批评也不是绝对的,开源软件的公开性也使得其底层架构的合法律性及合道德性受到公众的监督,这也使得开源大模型被跨国犯罪者或恐怖分子改造为具有危害性的软件的可能性降低。以艾尔默为代表的大模型开源的反对者所没有考虑到的是,如果大模型选择闭源,其对外界就会成为一种封闭状态。这种封闭状态确实可能会防止社会层面上对大模型的恶意使用,但会使得大模型的拥有者对其的使用缺乏社会监督,从而产生一种技术集权主义的风险。笔者认为,开源大模型是否可能被改造从而作为攻击性或破坏性的软件出现,主要取决于两个因素:一是大模型本身是否有被改造为危害性软件的潜力,二是大模型受到监督的强度。只有在开源大模型的危害性潜力高而监督强度低的情况下,才有可能对国际社会造成负面影响。基于此,笔者认为,各国政府和以联合国为代表的国际组织应该重视开源大模型可能造成的安全问题,针对其制定某种国际性的限制性条约,并设立专门的监督机构,而以GitHub为代表的开源发布网站也应当引入监督和审查机制。
从更宏观的层面上讲,大模型技术会对人类社会产生巨大的“创造性破坏”效应。即这种技术会在对人类社会的政治经济秩序产生破坏性冲击的基础上创造出新的秩序。但是,大模型所造成的创造与破坏这两种影响中孰能占据主导是我们不得而知的。大模型既可能以一种较为正面的形象出现,也有可能导致安德斯所言的“赤裸的天启”(Naked Apocalypse)。[30]大模型技术与核技术相类似,既可以被应用于能够产生巨大能量的核电厂,也能够制造毁灭性的核武器。安德斯认为,核灾难就是这样一种“赤裸的天启”。对大模型的开源如同核技术的扩散,会造成一种技术滥用。这种滥用可以被称为一种“技术民粹主义”。虽然少数人掌握技术的技术精英主义是不合理和需要批判的,但是作为其反面的技术民粹主义则走向了另一个极端。大模型的技术民粹主义的核心问题是,随着大模型技术的迅速普及,在大多数人受到的教育不足以使其理性运用的情况下获得接触大模型的权利,这是否可能会成为一股吞噬社会的力量?由于大模型的巨大算力,大部分人类在其面前就仿佛孩童一般,而如果让孩童去掌握核按钮,随之而来的极有可能是灾难性的后果。并且,以GPT为代表的生成模型和以Midjourney为代表的扩散模型都是基于神经网络算法,仍然存在算法黑箱的问题,亦即,虽然大模型技术由人所开发,但开发者只是负责算法的编写,而对算法组成的大模型的推理过程中更加具体的因果关系缺乏了解。[31]正如OpenAI的首席科学家伊利亚·苏茨卡弗(Ilya Sutskever)所言,大模型就如同一种炼金术。①大模型的这种黑箱就如同一个“潘多拉魔盒”,而开源就是打开这把魔盒的钥匙。
这种超级技术的无条件普及可能会使人类陷入一种总体性的危机之中,而人类却对此茫然无知。安德斯提出的“世界末日失明症”正是对这种社会危机的一种警示。[32]人类社会的秩序是建立在权威之上,但是大模型的迅速普及使大多数人都有了对抗权威的能力,这就会导致一种无序化。譬如,枪械在日常生活中是一种毁灭性的力量,拥有枪械的人对其他人会产生一种绝对的武力压制。而如果人人都拥有枪械,则社会就会处于一种较为危险的状态。大模型则会发挥出比枪械更强大的毁灭性力量,因为在一个合法持枪的社会中,政府还可以通过军队等更为强大的武装力量对社会进行总体性控制,但是大模型超强的能力使得现有的政府能力也显得相形见绌。在大模型泛滥的社会中,政府很有可能会失去其制约作用,从而使社会陷入霍布斯式的“一切人反对一切人”的总体性战争状态中。
① 苏茨卡弗曾发表推特称:“机器学习如同炼金术,它把硅变成精神和幽灵。”(ML is like alchemy, turning silicon into spirits and ghosts)参见:https://twitter.com/ilyasut/status/1090758866394988544。
04
技术扩散基础上的整体性对齐
技术进步和技术扩散是人类社会发展的必然趋势,人类既不可能也不应当逆转这一趋势。但是,面对大模型开源可能带来的种种问题,人类仍然有其主观能动性予以化解。面对大模型技术开源导致的技术扩散的可能负外部效应,有两个主要应对方向:第一是要在一定程度上通过闭源的方式对其造成的双重加速进行缓冲,第二是使用对齐技术使大模型与人类社会的价值观念进行对齐。技术与社会的适应是双向的。社会不应只是消极地改变自身以适应技术的发展,更应该对技术加以控制使之适应人类社会的基本规则和前进方向。这种控制在大模型领域就体现为对齐技术。对齐技术主要解决两个问题:第一是消除大模型所产生的幻觉,第二是使大模型能够遵守人类的价值观念。我们可以将这两种对齐总结为知识对齐和价值对齐。其中,后者更加困难,同时也是解决开源大模型问题的关键。OpenAI提出了“超级对齐”(Superalignment)的概念,即通过训练一个与人类能力相仿的“自动对齐研究者”(Automated Alignment Researcher)智能体,从而实现对齐的智能化。[33]
图1 大模型开闭源的动力和竞争的核心争论
然而,在目前,对齐技术还存在种种问题。首先是对齐标准的问题。大模型是一种“上文预测下文”的技术,其输出是将权证(Token)以一定的算法逻辑进行排列。权证是文本的最小单位,是大模型语言中的基本语素。乔万尼·萨托利(Giovanni Sartori)用“抽象阶梯”的方式将抽象概念分为三层,由高到低分别是:普适性概念(Universal Concept),其可以在异质文化背景下进行全球范围内的比较;一般性概念(General Concept),其可以在相对同质的背景下进行国家间比较;轮廓性概念(Configurative Concept),其适用于国家内比较。萨托利指出,对概念的运用不能够跨越抽象阶梯,否则就会出现“概念旅行”(Concept Traveling)以及其所引发的“概念延展”(Concept Stretching)问题。[34]但是,由于主导大模型研究的是以美国为首的西方国家,故对大模型进行对齐时,不可避免地会以西方的概念和理论作为标准。我们可以用海德格尔对解释的讨论来阐述这一问题。海德格尔认为,三种因素构成了解释的基础:首先是人类在解释中不可避免地存在一种先验的取向,即先行视见(Vorsicht);[27]192其次是人类个体所处的社会历史背景,即先行具有(Vorhabe);[27]192再次是人类对解释对象的预先把握,即先行掌握(Vorgriff)。[27]390在西方技术团队对大模型的对齐过程中,其对大模型所输入的正是这种西方意识形态的先行视见、先行具有和先行掌握。
其次是如何将人类价值观编码进大模型中,亦即,如何将人类的哲学价值观念翻译为代码。老子曾说过:“道可道,非常道。名可名,非常名。”[35]佛家也有类似的对“不可说”的论述。[36]这其实是在表明,许多人类哲学思想是语言难以表达的。路德维希·维特根斯坦认为,涉及价值观念的伦理命题是不可说的。[37]而这种不可说反映到现实生活中就体现为价值性概念的争议。譬如,对“自由”“正义”等概念,人类在几千年的争论中仍未有一个共识性的描述。而将这种难以用自然语言表达的概念转化为代码更是一种难上加难的工作。这种工作实际是对上述提出的代码解释的一种反向过程。并且,人类的价值观内部以及价值观之间也存在着冲突,譬如公平与效率之间的冲突。而大模型在面对这种冲突时如何对价值观进行优先级的排序亦是一个重要的问题。
大模型的价值对齐困境引起了广泛的讨论。有学者提出,价值对齐这一概念本身就值得商榷,大模型必须与人类价值观对齐只是人类的一个先入为主的理解,是一种人类中心主义。[38]但是,笔者认为,哲学层面上的探讨和现实中的具体行动之间存在一定的张力。作为人类,使自己发明的工具遵循人类社会的价值观是一项基本的义务。针对大模型的价值对齐问题,笔者拟提出整体性对齐这一概念,即从宏观的整体性层面上对大模型进行价值对齐。这一概念主要包括三个基本方面:阶梯性的对齐、人与大模型的双重对齐和大模型生产全过程对齐。
第一是阶梯性的对齐。在借鉴萨托利“抽象阶梯”概念的基础上,笔者拟提出大模型的“对齐阶梯”。即在大模型的对齐中,最基础的是制定一些可执行的、被人类社会所普遍认同的法则。阿西莫夫的“机器人三原则”即是对此的一种很好的尝试。再上一层是大模型在不同的国家运行时对各国的价值观和法律的遵从。譬如,在个人和集体的价值冲突中,中国更倾向于集体主义,而美国更倾向于个人主义,而两国所研发的大模型则需要各自对这种倾向进行对齐。最高层则是大模型在具体的应用场景中的具体价值判断。譬如,在大多数场景当中,人工智能对人类的欺骗都被看作是不可接受的,但如果人工智能被应用于执法之中,则应当在一定程度上接受其对犯罪分子的欺骗。大模型的对齐就是对这种“对齐阶梯”的攀登,其对人类道德和规则的学习应当先从最基本的价值观开始,之后顺着这种阶梯而上,逐渐学习更加具体的应用范围中的具体要求。
第二是人与大模型的双重对齐。对齐不应当仅仅是大模型向人类对齐,人类也应该向大模型进行对齐。大模型向人类对齐,是因为大模型必须适应人类社会的价值观念,从而使得大模型能够在融入人类社会的基础上改善人类生活。而人类向大模型对齐,则体现了“以大模型为师”的观念。“三人行,必有我师焉”是孔子的一句名言。杰弗里·辛顿(Geoffrey Hinton)认为,大模型已经成为一种“超级智能体”,其智力水平完全凌驾于人类之上。[3]1对于大模型这样一种超越人类能力的大他者,人类的反应不应当是排斥或畏惧,而应当以一种谦虚的态度将其当作学习的对象。同时,人类不应仅限于学习其所掌握的巨量知识,而更应当学习其思维方式。譬如,在AlphaGO战胜人类顶尖棋手后,人类棋手并没有因此气馁,而是积极学习AlphaGO的棋路,从而提升自身水平。[39]
第三是大模型生产全过程对齐。不仅是大模型本身要与人类的价值观对齐,大模型的整个生产过程都要与人类价值观对齐。换言之,大模型制造的每一个阶段都应当符合人类价值观。首先,造成负外部效应的除了大模型本身,还有大模型的生产过程。譬如,理查德·凯德利(Richard Kadrey)等三名作家控告Meta非法使用其作品训练其大语言模型LLaMA,这些作品包含在一个名为“The Pile”的盗版资源数据集中的第三大子数据集“Books3”当中。根据反盗版组织“权利联盟”(Rights Alliance)的报告,Books3来源于臭名昭著的盗版图书网站Bibliotik,其共包含37G的数据。[40]另外,人类创造大模型的行动中所体现的价值观是否会影响大模型本身?这里的问题在于,如果人的行动不符合某种价值观,那么这种行动的创造物即大模型是否符合这种价值观?现实主义者如马基雅维利认为,为了达到善的目的可以不择手段,这种手段上对善的违背并不会影响善的结果。[41]也有观点认为,过程和结果不能被明确二分。艾尔弗雷德·怀特海认为,过程是世界的本质,整个世界都是一个“广延连续体”。[42]佛家也有关于善因、善果的观点。①根据量子物理理论,量子运动是一种波函数坍缩的过程。亚历山大·温特据此提出了“量子意识理论”,这种理论主张意识本身是量子力学的,并且意识构成“意向性”——即人类心理状态——的基础。温特认为,人类可以制造出某种看似具有意向性的机器,但这种意向性终究来自人类。[43]大模型正是温特所指的这种机器,制造者的意向性会通过制造过程输入大模型。因此,大模型本身会具有制造者在制造过程中所遵循的价值观念。
整体性对齐的实现机制应当包括透明性机制和协商机制。社会需要更多了解大模型的技术细节和潜在风险,因此,这就需要有一定的透明性机制来加以保障。不仅大模型本身的架构要通过适当的开源加以透明化,大模型的制造过程本身也应当有一定程度的透明性。而协商机制是共识形成的基础,无论是共同体内部还是共同体之间,都需要围绕大模型展开更多的协商。在开发团队层面,需要在开发大模型产品的过程当中考虑到外部受影响的民众,使其以协商代表或公民代表的方式参与到开发过程中。在国家内部,应当适当引入协商民主机制,确保大模型的相关制度规范诞生于社会各界的共识。在国家与国家之间,则应当建立更多更深入的交流对话机制,不断推进大模型领域的国际合作。
①“有智之人先当观因,次观果报,知从善因生于善果,知从恶因生于恶果。”参见:《大般涅槃经》,[北凉]昙无谶译,上海古籍出版社,1991年版,第206页。
05
结语
开源与闭源是目前大语言模型发展的一个重要争论,并且这一争论的走向尚不明朗。目前,闭源大模型占据优势,这是市场经济的规律所致。而开源大模型也因为其独特的价值而继续得以存有一席之地。笔者认为,开源与闭源并不是大模型未来发展非此即彼的选择。实际上,大模型的开源与闭源之间具有一种微妙的平衡。如果开源大模型完全代替了闭源大模型,就会导致大模型的开发失去经济激励,从而使整个大模型市场失去发展动力。而如果闭源大模型完全代替开源大模型,则会产生上述“重复发明轮子”等问题。笔者认为,未来的大模型市场,闭源大模型仍然会占据主流,并且开源大模型与闭源大模型的市场份额将会保持一定的比例,从而构成某种平衡,使得开源与闭源二者的优势都能得到充分发挥。开源的本质是一种技术扩散,而技术扩散是一把双刃剑。由于大模型技术本身的社会风险性,开源在扩散技术时也在扩散风险。笔者认为,大模型技术本身的风险与技术扩散的风险是一种源与流的关系。要解决开源带来的负外部效应,仅仅通过闭源的方式来遏制大模型技术的扩散是不够的,而更应该从源头上对大模型技术本身的风险加以应对,即应当在整体性层面上对大模型进行对齐。这种对齐应当包括阶梯性的对齐、人与大模型的双重对齐和大模型生产全过程对齐三个基本方面,而其实现机制应当包括透明性机制和协商机制两大机制。
参考文献
2024 · 第5期第7篇
特别说明:
(1)本公号仅用于学术信息的发布与交流,不存在任何营利行为;
(2)本公众号推文使用图片除特别说明外,均来自于网络。
往期推荐
编辑:张雪怡
校对:康仪欣
终校:杨丽雯