“透明性”与“黑箱化”: 新媒体“界面”的技术现象学
上海大学文学院
本文载于《外国美学》40辑
江苏凤凰教育出版社 2024
有学者将对透明性的要求,分为“鱼缸(fishbowl) 透明性”和“理由 (reasoned)透明性”,人们希望通过引入适度的“理由透明性”来部分替 代“鱼缸透明性”,在社会分工、权利让渡、知识专门化的当下,去平衡监督权和组织效率的关系,而“鱼缸透明性”仍作为监督的最基本保障。落实在算法领域,要拥有“鱼缸透明性”,实现机制的可解释性,设计者可以在算法设计上将可解释性作为生成模型的一项评估参数,附加到生成过程上;同时作为技术和数据的使用者,为了取得合适的政治伦理评估,需要对理由进行外部的透明化。
但是,机器学习算法的透明性实现的困难,比一般的信息透明更甚。机器学习的机制依赖大量自我迭代,通过经验数据进行拟合,生成过程随机,设计者难以预测结果。主要用于预测的机器学习,它所面临的冲突,不仅在可解释性与高效率之间,更在可解释性和预测准确率之间:“黑箱化”本身就是机器学习算法在达成实施效果过程中的伴随物。也就是说,“透明性”与“黑箱化”的关系虽表现为对立性,却更有发生意义上的同源性。这一关系,不仅存在于机器学习和AI 算法领域,实际上也广泛存在于界面工程学、信息科学,以及人类认知和行为领域。
在计算机的界面交互设计史上,曾经有对“透明性”的执着追求,美国认知心理学家唐纳德·诺曼(Donald Norman)的《界面为什么不工作?》(Why Interfaces Don't Work?)一文提出,任天堂的游戏机在界面的透明度上完胜苹果计算机Apple IIGS。同为一款“California Game”的游戏软件,在任天堂的家用游戏机SFC上可以即插即用,而在Apple IIGS上却要经历一系列烦琐设置:“任天堂也是计算机,但是它却伪装得像一个游戏。用户们仅仅想玩游戏而已,任天堂使之实现得如此简单而直接。”相比之下,早期苹果计算机在诺曼看来不够易用:“界面的真正问题在于它是一个界面。界面是碍事的,我并不想将精力花在界面上[……]不能将注意力吸引到它之上。当我使用电脑时,目的是完成工作:我不想觉得是我在使用电脑,而是觉得我在进行工作。”诺曼将界面视为一种“阻碍”, 界面设计的最终目的在于创造出一种“无界面的界面”, 这一理念深深影响了人机交互理论。界面的透明性成了人机交互的首要追求,它希望人类与机器之间的信息能够通达无碍,从图形用户界面(GUI) 到自然用户界面(NUI) 的发展趋势,乃至“脑机接口”也在宣示着这一努力。
以诺曼为代表的人机交互理论家展现了一种实用主义的愿景:计算机媒介不过是一种信息设备,是向用户传递内容的“工具”(instrument), 也即香农(Claude Shannon)的信息论意义上,将内容从发送者传送到接收者的通道。这种“透明性”是工具为实现用户的使用目的而在实施效果上的透明。另一方面,为了技术工具的无碍,“工具”的运行原理却需要尽可能地隐藏,以减少操作层面的障碍。为此,计算机媒介的运行过程需要尽可能地“封装”, 从而其运行原理就被“黑箱化”了。而算法的透明性要求看起来恰好导向了相反的方向:人们要求的不是目的的透明,而是暴露黑箱,以实现过程的透明,这也就是媒介理论家雪莉·特克尔(Sherry Turkle)所说的“打开顶盖”以看个究竟。特克尔认为,这代表了一种现代主义的技术美学,尽管用户并没有查看源代码的需要,但是这种开放的可能性需要被包含在系统设计之中,也就是能够“接触到操作系统内部”从而“看到魔法后面有什么”, 这种美学观念由前述的民主政治实践中的透明性诉求所驱使;而前者对特克尔而言则意味着一种后现代主义的美学观念,即比起对深度和机制的探索,“探索不断变化的表面世界比着手寻找起源和结构更现实”。从而,特克尔将这两种“透明性”归为现代主义和后现代主义美学在20世纪80年代后半期的互相竞争。
麦金塔电脑
然而,如果说在媒介技术的目的透明性与其技术原理的过程透明性之间,诺曼对界面交互设计的易用性追求代表着拒绝深度机制的一方,那么, 在一种媒介技术的工具性要求与媒介作为艺术的自我呈现之间,它却又被置于“探索界面”的对立面。在诺曼“无界面的界面”招致的批评中,最为人熟知的就是媒介理论家大卫·博尔特(David Bolter) 对界面透明性神话的反思。这一神话以麦金塔电脑 (Macintosh) 的用户图形界面为代表,它例证了博尔特对“再媒介化” (remediation) 的双重逻辑中“直接性”(immediacy)的描述。然而,“再媒介化”的另一重逻辑是“超媒介性”(hypermediacy), 这种“对媒介的迷恋”也正如“对透明直接性的渴望”, 都有其对应的具象化实践:如果说诺曼代表了一种界面美学的“包豪斯风格”, 那么对“超媒介性”的媒介考古则可以追溯至“巴洛克式”的古玩陈列柜(Wundwkammer), 它不断彰显着自身的物质材料特性,时刻将我们的注意力引向它繁复的 纹理。而在当今的数字媒介中,它表现为以图像、声音、文本、动画和视频拼贴而成的“多媒体的随机访问组合”。
由此可见,媒介工具的“透明度”在对其深层原理的探寻渴望和对其制造的表象沉迷的坐标上不断变动,这也展现了“透明性”概念的多变。然而,特克尔将两种透明性分别指派为不同的美学范式,将之归因为竞争关系实则是对博尔特所揭示的“再媒介化”的双重逻辑的简化。在博尔特与戴安娜·格罗马拉(Diane Gromala)合著的《窗与镜:互动设计、数码艺术与透明性神话》中,界面的这一双重属性就分别对应着可“看透”(looking through)的“窗”与可“看见”(looking at)的“镜”的隐喻。尽管“窗”与“镜”常作为艺术表象呈现状态的经典隐喻而出现,但在这里博尔特并非要呼吁我们在两种美学偏好之间进行价值判断,而是说明即便是出于界面设计的实用主义考量,界面的透明性与遮蔽性(源自“镜”的反射涂层)仍都为我们所需要。更确切地说:“界面应当在透明性与反射性之间以一种可控的方式振荡,用户图形界面的本质是可控振荡。”
特克尔试图以不同时代的美学范式来化约工程学设计的相异主张,其意义虽不局限于工程学实践层面,但因其没有处理机制起源问题,导致过早地抽空了新媒介中的技术特征,错过了发现这一对立现象的内在共生性的可能性。而借由界面批评的双方代表同时触及的一个现象——诺曼和博尔特不谋而合地谈及“故障”和“不工作”等现象,试图用非常例状态的视角转换,达成一种界面批评理论的进路,得以把媒介性问题从工程学视域转向技术哲学的考察。
技术在此“好像融入我自身的知觉的——身体的经验中”, “成为我对周围环境的日常经验的一部分”, 它们“抽身而去”, 在这种关系中形成了最大程度的“透明性”。同理,诺曼对交互界面的具身化的要求可表示为:
然而,这种期望存在矛盾:“一方面希望完全的透明性和完全的具身,希望技术能真正‘成为我’。如果这是可能的,那么这就等于没有技术,因为完全的透明就是我的身体和感觉;我希望能直接接触,这样我就能不借助技术来经验。但这只是这种期望的一个方面。这种期望的另一面就是拥有技术所带来的力量和转化。只有通过使用技术, 我的身体能力才能得到提升和放大。”
于诺曼而言,计算机媒介的“成为我”是界面设计师的努力,界面是被设计为无碍的,正如伊德所说:“设计的完善不是只与机器有关,而是与机器和人的组合有关。机器是按照具身的方向完善的,根据人的知觉和行为来塑造的”, 所以诺曼称任天堂的游戏机SFC“伪装”为一个游戏。而伊德对技术具身化过程的描述则更偏向技术媒介使用者掌握工具的过程(“学会使用助听器和手杖”)。因此,伊德对这一双重性的揭示,实则是将技术媒介透明性的疑难归为以下两个同时存在的经验性的事实:其一,目的的达成依赖于对技术原理的理解和掌握;其二,对技术工具的熟练使用,会使我们忘却对过程的感知与理解。对于后者,即一种技术媒介具身带来的透明化,直接来源于海德格尔对工具“上手状态”和“抽身而去”状态的揭示。
任天堂SFC
对于这种工具使用情景如何再现,海德格尔给出了一个有价值的路径:通过对工具的故障状态的描述,来间接地使工具从知觉的扩展转化为知觉的对象,这种经验事实确实也是伊德的关注对象。但是伊德指出,这种负面性的转向并不是使情景显现的唯一和固有的方式。具身的技术增强了人的知觉,这种具身技术固然仍需训练,但是具身技术和知觉具有同样的结构,它具有相当程度的直接性,从而缩短了人与世界的距离。具身技术的透明性趋向根植于与知觉同构的直接 性,同时又无止境地迎合知觉扩张,使透明性越发困难。
为了修正胡塞尔由于极端区分生活和科学从而给文化习得的现实带来的困难,伊德把通常与身体感官直接联系的感觉知觉称为微观知觉(microperception), 把基于文化的、经由诠释的知觉称为宏观知觉(macroperception) 。微观知觉和宏观知觉的区别不在于科学世界/ 生活世界或理性/感性的差异,即使是源于身体的微观知觉,也受惠并受制于宏观知觉。经由代际积累的知识,知觉的直接性发生转变。伊德对胡塞尔做的这一修正,使身体知觉和文化诠释处于一种双向的运动之中。他并不认同胡塞尔对现代科学世界和现代生活世界之间替代性关系的描述,而是认为经由微观知觉和宏观知觉的往复,使现代科学的文化习得保存到了我们的身体知觉中。
对于具身性在宏观知觉和微观知觉之间的交互往复,是伊德对海德格尔的“工具”在技术与生活关系上的展开,而对于“人一技术”的第二个面向——诠释学关系,则是对前述透明性问题的一个倒置,这一分析将回答我们最初提到的透明性问题的两难,也能对一直以来透明性问题在目的和过程上的摇摆不定做出解释。航海图技术,从设计目的来说力图清晰无误,对于赖以工作、生存的海员来说,熟练掌握航海图也是应有之义。然而,人通过航海图技术达到与实际的海域之间的透明性,却不是完全凭借知觉的透明性,而是部分凭借诠释学的透明性得以成立的。伊德所用的航海图的例子,实际上搭建了一个由知觉同构向诠释方法之间过渡的桥梁。因为航海图既有与知觉同构的位置信息,又有经过图例法抽象、变形、增减而成的文本特征。尤其关键的是,“我”的知觉对象从世界本身转向了技术自身,技术就不能完全 “抽身而去”。这被图式化为:
通过伊德的图式反观计算机界面理论的透明性历程,从命令行界面到早期图形用户界面的技术成就,增强了与知觉同构的视觉图形——窗口。而图形界面引入的微观知觉,随着个人计算机的普及影响了宏观知觉,即通过计算机界面文化,透明性从知觉关系向诠释学关系发展。以下例子可以为证:拟物性的图标越来越扁平化和符号化,如“保存”按钮以3.5英寸软盘为构图,但逐渐失去了起源上与软盘的实物在知觉上的象形关系。个人计算机不只是用来“观看”计算 结果的技术工具,它的工作场景需要依赖多种诠释学的透明性,那么 界面就不能是完全透明的。这就是《窗与镜》对诺曼“无界面的界面” 加以反思的原因:“为了使界面发挥作用,用户应该看着界面,而不是看透它:例如,激活图标或选择菜单项。此时,界面不再是一个窗口, 而是一面镜子,反映用户与计算机的关系。界面实际上是在说:‘我是一个计算机程序,而你是该应用的计算机用户。’”
3.5存软盘
作为早期透明性界面设计的里程碑,以下案例从另一角度说明了“界面”的透明性追求在最初就存在某种“转换”。麦金塔电脑的重要界面设计师莱瑞·特斯勒(Larry Tesler)在1984年提出了复杂性守恒定律,主张“每一过程都有其固有的复杂性”。他力图通过创造一种良好的诠释系统,让用户可以不必面对过于复杂的交互方式,从而将用户的复杂性“转换”到设计师的复杂性上,而不是将其凭空消灭。而苹果公司的人机交互界面团队创始人布鲁斯·托格纳兹尼(Bruce Tognazzini)则对设计师为用户承担复杂性尺度有所保留,因为人们生活中的复杂度会逐渐增加,从一种复杂性中解放出来的用户会不断要求增加其他需求的复杂度。
事实上,胡塞尔提出的“科学危机”, 正是卢梭对西方文明,特别是科学和技术发展的批判传统的延续。在博尔特的界面批评中,媒介的 “直接性”(immediacy) 正是它“透明性”追求的体现,这也是卢梭的透明性追求所倚赖的。而其反面,则是一种缺乏直接性的“推论性”。如果对卢梭在他著名的檄文《论科学与艺术》中列举的自己所质疑的科学学说加以考察,会发现其共性是“都与一种将物理实在进行数学转化的风潮相关”, 这也就是胡塞尔所说的“伽利略将自然数学化”。例如,牛顿“在《自然哲学的数学原理》中所遵循的是一种公理方法,而不是分析归纳法”。由于它比遵循分析法更需要创造力想象,并且可以“从任何地方开始”, 因而与亚里士多德以明证性为基础的科学原则构成了根本差异。特别是这种非直接性以推理的序列或“链条”的连续推论方式去把握真理,在带来了知识扩张的同时,也导致了透明和直观的丧失。
所谓“推论链条”, 即胡塞尔所说的起源相似性消失的过程,也是知觉的直接性散逸的过程。卢梭极具先见地预言了自然的数学化导致起源相似性消失的危机,而这在现代科学中更为突出:与推论性特征相伴的,是科学观测的对象进一步挪向不可见物。它的知觉同构往往依赖更单一的实验室环境,因而与生活世界的距离更加遥远。正如梅洛-庞蒂在《眼与心》中说,在实验控制之下,“只有一些高度‘加工过 的’现象才会起作用,我们的仪器产生这些现象而不是记录它们。由此产生了各种各样漂泊无根的尝试。”现代的望远镜也不再似伽利略的时代,经过透镜将月亮从天空背景中“摘取”出来,而是通过电子成像的原理进行捕捉绘制,诸如高能粒子等的物理对象,则只能一方面通过数学的模型建立理论存在,另一方面通过各种科学装置来“观看”。
尽管在科学推论问题上,伽利略将自然数学化,开启了知觉的“非透明性”, 造成了直接性的散逸,但就科学观测方面而言,伽利略时代的望远镜仍未脱离“透明性”的追求。相比之下,现代科学的对象,必须要以一种“界面化”的方式,才能为我们所把握,这一界面不再如望远镜的透明玻璃一般让我们“看透”(looking through), 而是可“看见”(looking at)的电子成像。事实上,媒介理论家威廉·弗鲁塞尔(Vilém Flusser) 在《技术图像的宇宙》中,正是借用了现代物理学的研究对象的呈现方式,来说明如今的技术图像的特点的:“它们其实根本不是图像,而是 化学或电子运作过程的征象。拿着一张照片,我们就能向化学家展示银化合物的特定分子如何与特定的光子发生反应。电视图像可以向物理学家展示特定电子在电子管中运动的路径,它们使这个过程变得可见,就像威尔逊云室能展示粒子的轨迹一样。”当博尔特把界面描述为一面反映用户与他的周遭环境的关系的镜子时,计算机的“界面” 这一 “镜子”也反映出了使用者所处时代的科学世界的状况。
同时,这一描述揭示了原始图像与技术图像的重要区别。弗鲁塞尔的《传播哲学》(Kommunikologie) 指出:“原始图像指向了世界中的情境,技术图像则标志了概念;原始图像直接表征了世界,技术图像则需要文本的中介间接地进行表征”, 因此,它们是“覆盖着符号的平面,这些符号又意指了线性文本的符号”。不同于可视物体的客观性, 我们也只有通过阴极射线管或威尔逊云室这些特定的介质,才能看到那些粒子。正如天文学照片是由观测仪器所产生,因而“属于技术图像的范畴;要正确解读它们,需要人们对其中所包含的‘天文学文本’ 有充分的领会”。这就是技术图像最重要的特征——有待诠释的、文本化的图像。
因此,对技术图像的“观看”, 也就兼具“具身性”和“诠释学”的双 重特征:一方面是“文本化”, 另一方面,正如科学哲学家伊恩·哈金 (Ian Hacking)提请人们“注意显微镜观察小物体时所使用的栅格”, 知觉在肉眼观看栅格和显微镜下观看栅格的同构性,也能辅助定位难以直接观测的实体及其关系。因此,在这一层面,技术图像也并未放弃对知觉直接性的追求,而是通过可视化的界面,不时回到知觉具身性,引入现有或新发明的技术中介中,使自然的黑箱化状态不仅获得数学模型上的构建,也获得技术中的具身理解,从而抵抗推论性带来的非直接性的危机。这种具身理解不应过度提高到它不能达到的普适性,因为人类的认知和行动空间,总体有一个不可逆转的复杂性提升,具身透明性无法也不必做到裸露的“亚当”状态,它只是让人们通过诠释学层累的知识,在远离知觉同构性起源的运动中,时刻进行的连接反馈行为。
技术现象学通过世界的文本化来使人获得对世界的理解,这将一个古老的疑问带到了现代,即作为中介的语言的透明性问题。艾曼努埃尔·埃洛阿(Emmanuel Alloa)在《感性的抵抗:梅洛-庞蒂对透明性的批判》中说:“我们可以清楚区分出语言透明性观念论的两种形式:
第一种认为符号与对象相对应;而第二种情况下,符号与意义相符合。”这一表述的更早版本可追溯至古代典籍中,对作为逻辑学家与作为博物学家的亚里士多德的两个描述:前者称“在他写作《解释篇》 的时候,亚里士多德把他的笔浸在思想中”, 而后者称“亚里士多德是自然的抄写员,他把他的笔浸在思想中”。在阿甘本看来,这揭示了 “思想只有通过纯粹地指涉自身,用它自己不透明的墨水填充它的笔, 才有能力书写语言与思想以及思想与世界之间的关系。”得益于该考据,可以将这两个版本并置齐观,并发现二者的重要差异:逻辑学家亚里士多德和自然学家亚里士多德,前者以语言作为思想的中介,后者则把语言作为世界的显现载体。语言浸在思想中意味着一种相即性, 而阿甘本对此冠以“不透明的墨水”的称述,也就是说,中介物是通过使自己不透明的方式,来达成一种可见性。
这种不透明性长期为艺术所注意。自然厌恶真空,而艺术厌恶透明。卢梭以否定性的方式揭示并批判了艺术的不透明,而博尔特则基于正面的主张强调界面需要不透明性。在博尔特的《窗与镜》中,除了界面自身需要宣示存在,以及界面损坏时自身显示的必要和必然以外,还有一个重要的艺术面向。对于界面设计师和界面艺术家来说, 作为艺术发生场所的界面,需要让界面自身可见,并照见用户和设计师自身,这种“镜”也就是一种能够让意向性得以显现的媒介。正如弗鲁塞尔对人们如何掌握技术图像的描述:人们“从事各种计算机媒介上的工作,是为了将‘他异世界’(alternative Welt)投射(projizieren) 到现实中来,也就是将艺术乃至人类生存的各种可能性,将人们自身 将去往何处的设想,召唤到现实的世界之中,而这正是创作所具有的共同特点”。这一“他异世界”之所以能够存在,恰恰是对计算机媒介运行原理的“封装”,使之不完全对人们“透明”, 从而呈现出技术图像 的“界面”, 才得以完成的。
伊德的技术现象学也同样注意到了“他异性”,在他对于“人一技术一世界”关系的描述中,除了具身关系和诠释学关系,还有一类他异性关系(alterity relations)。“在具身关系中,如果技术强行闯入世界, 而不是有利于人通过知觉和身体扩展到世界中,那么技术的对象性 (objectness) 就必然从负面的意义上显现。”人工智能就是这样一种技术,在这一层面上我们遭遇的黑箱化问题,实际上来源于面对了一种技术的他异性。伊德借用列维纳斯的这一术语,用来指称既不能还原成对象,又不能还原为手段的技术。他用“准他异性”来替代列维纳斯的“他异性”, 实际上并不将这类技术看作绝对的他异性。伊德认为,完全的他异与完全的具身一样是不可能的幻象,绝对的黑箱是绝对透明性的副本。准他异性技术仍处于“人一技术”具身、诠释、他异比例不同的序列内,人仍然可以正面地和这类技术打交道。
伊德对人工智能黑箱的“准他异性”界定,已经构成了对黑箱化困境的回答。但是伊德并没有给出实际打交道的范式。然而,对这一困境的破除可以从列维-斯特劳斯《野性的思维》中提出的“修补匠”概念中得到启发。与这一概念相对应的是“工程师”: 工程师的世界是笛卡尔式的理性透明性,遵循数学化的原理,对黑箱的内部原理具有全面而细致的掌握;而修补匠的世界是根据以前的剩余物的不完备收集, 他对自己所修补、拼贴和组合的对象并无完备的知识,但却有能力应对包含例外状况在内的各种状况。
而修补匠对于准他异性技术,则可以通过要求“打开顶盖”, 但不求“看个究竟”的方式进行交互。透明性的难以处理之处,有时在于专业性知识的要求。但是,一种宽泛的、非专业的交互方式,在计算机媒介与人工智能的美学范式中早已存在:计算机技术社区推崇分享和开源;DIY是技术社区的重要精神;作为与技术发展相伴而生的黑客文化,同样是不可忽视的一种力量……“黑箱”正是由此种种而获得了可交互性。
正如尤西·帕里卡(Jussi Parikka)所说:“蒸汽朋克也是媒介考古学精神的美好象征:这种精神将新与旧并置思考,并借由美学、政治及 其他批判探究领域来培养对媒介、技术和科学的热情。即使冒着后现代怀旧的风险(参见詹姆逊1989), 或者庆祝在日益封闭的黑箱消费者媒介景观中已经失去之物,蒸汽朋克仍被打上了积极的修补匠精神的烙印。”这种充满热情和参与性的修补拼贴精神,是抵抗黑箱化的一种更自发的力量,它不求助于与黑箱处在共谋关系的完全透明性,也不执着于一种合乎规范的交互界面。种种利用旧知识进行作业的方法,或有效或无效,不可预料地与黑箱化的技术打交道。
在尤西·帕里卡所提到的“蒸汽朋克”艺术题材中,修补匠正是其中重要的美学元素,这在蒸汽朋克与它的亚种——“柴油朋克”——的比较之下尤其明显。“蒸汽朋克”具有一种“打开顶盖”的机器美学:一方面,可以信任的理性力量,通过齿轮结构的外显传递到感官知觉;另一方面,修补匠角色可以自由进出,凭着护目镜和扳手的简易交互方式,用各种零件进行拼贴、改造和修补。整个世界呈现出积极乐观的探索精神和自由气质的美学。而“柴油朋克”, 则以铁皮铆钉封闭了巨大的钢铁机器,没有修补匠的容身之地,一个个大型黑箱只能通过大型政治实体来制造,战争阴云和毁灭性的美学元素充斥其中。以人工智能为代表的技术想象,在这两种美学样态中得以构建。
回到本文所论的人工智能的黑箱化问题,通过现象学及它所欲求 修正的“科学危机”,我们可以反观本文最初提出的两难。完全的自上而下的透明性,采取的是一种笛卡尔式的计算主义范式,通过有限的基础算法,来解答交予人工智能回答的问题。这类人工智能是莱布尼茨轮式计算器的现代版本,它的困境在于无法回答超出设计者知识范围的问题。完全的自主自为的黑箱,则是一种行为主义的范式,它的困境在于难以与人类的生活经验相连接。而我们所赞许的,正是一种人类学的方式,用“修补匠”的态度对“工程师”的世界进行重要的补正。
《外国美学》第19辑-40辑