【未来批评】《主体性和共体性:隐藏在AI里的那个人》| 廖令鹏

文化   2024-07-30 09:36   广东  


点击蓝字,关注我们



作者简介

廖令鹏,中国文艺评论家协会会员,深圳文艺评论家协会理事,历届睦邻文学奖评委,在《文艺报》《文学报》《中国文艺评论》《小说评论》《青年文学》等报刊发表评论百余篇,出版批评专著《新城市文学的新语言》,曾获第二届全国青年产业工人文学大奖文学评论奖、深圳青年文学奖、粤港澳大湾区文艺评论奖等多种奖项。


阅读提醒:全篇5152字,本文节选1706字


人类存在的重要价值和意义是什么?


特斯拉创始人马斯克,这个预言AI很快将超越人类智能、AI比最聪明的人还聪明的科技狂人曾经说过一段话,“你可以把人类想象成数字生命的生物引导器。如果你不知道什么是引导器,我可以换一种方式解释,这是一段极短的代码,但没有它,计算机是无法启动的,这就像计算机启动的最小代码,就像硅电路自己无法演化出来一样,它需要生物来启动进化。”


无独有偶,腾讯研究院出版的第62期《互联网前沿》的封面标题赫然写着:“把自己作为AI——超级个性养成参考”。其中一篇文章《把自己作为AI——一次试验得来的四条建议》,就是作者在和GPT4.0经过多轮对话后,总结了GPT4.0对于人类向AI学习的四条参考路径:数据驱动决策、强化逻辑思维、提升识别能力、持续优化自我。


AI需要生物(人)作为引导器来启动进化,与此同时,人也要把自己作为AI的一部分持续进化——前者是马斯克的观点,后者就是AI的建议。在自我进化的冲刺中,AI正在和人类展开激烈的竞赛。既是竞赛,就有起跑线和终点线,就有规则和裁判,“AI价值对齐”,便成为当下探讨的热点话题。


AI进入大模型时代后,各种“类人”“超人”和“模型人”能力持续涌现,其自主性、通用性、理解力快速提升,成为面向未来的新型底层架构。


然而,随着大模型开始像人类一样从事语言理解、内容生成和社会服务任务,开始像Sora等打通文字、音频和视频的界限,广泛出现在人类生活当中,人们面临一个最根本的、颇具挑战的问题:错误或虚假信息,如人工智能虚构事实而出现“幻觉”;算法歧视,特别是在算法自主运行模式下,开发者既无法控制其运行过程,也无法向外界对此进行解释;能力风险,如AI追逐权力、欺骗人类、不服从;滥用问题,如恶意分子通过对抗性输入、“越狱”等方式让大模型与自己同谋。因此,如何让AI大模型的能力和行为跟人类的价值、真实意图和伦理原则相一致,确保人类与AI协作过程中的安全与信任。这个问题被称为“价值对齐”。


怎么实现价值对齐?在这个问题上,人类的技术性和人文性出现分歧,人类的价值特征和群体特征突显出来了。


首先需要明确的是,人类价值是一个复杂且多元的概念,它包含了道德、伦理、文化、社会风俗等多个方面,它并非一成不变,而是随着社会的进步、科技的发展以及个体认知的深化而不断演变。我们要理解对齐的“人类价值”与真正的人类价值之间的差异,尽管AI在处理信息、执行任务和进行决策方面表现出了惊人的能力,但它仍然缺乏对人类情感的深刻理解和体验。即使AI能够遵循一套预设的道德和伦理规范,它也可能无法完全理解和尊重某些人类价值,如尊严、同情和公平等。


此外,人类价值在不同的文化和社会背景下具有多样性,不同的国家和地区、不同的民族和宗教,甚至不同的个体都可能拥有不同的价值观念和道德标准。所以AI在追求与人类价值对齐的过程中,可能会面临难以调和的价值冲突,会经常性地出现人类道德和价值困境,比如在战争决策、医疗决策、基因编辑、自动驾驶等领域,以及伦理学最为知名的思想实验“电车难题”。


我们和AI一起走在大路上。AI只能先解决技术和进化的问题,还没有办法考虑到这些具体的问题,特别是具体的人的问题。对于如何实现价值对齐,工程师探索的一种方法是将人类反馈引入强化学习,这是显而易见的。关键在于另一种方法——监督。这涉及AI治理,业界一直在探索如何借助AI监督,包括AI自我监督、一个AI系统监督另一个AI系统等方法实现AI对齐。


美国的AI大模型公司Anthropic提出“宪法性AI”模式,即从低效的“人类监督”转向更高效的“规模化监督”,比如通过结合自己的实践经验、借鉴世界人权宣言、苹果公司的服务条款、DeepMind 的Sparrow规则(如“禁止聊天机器人假装自己是人类”“不发表威胁言论”和“不发表仇恨或侮辱性言论”等),研发一个从属的AI模型,用于评估主模型的输出是否遵循了特定的“宪法性”原则。规模化监督实际上承认了人类监督的复杂性与脆弱性,而转向了监督的效用,即目标导向,这是可以理解的。


但问题也接踵而来,人类监督在规模化监督中扮演什么角色?谁来监督这个“从属的宪法性AI模型”?人类是否要再研发一个从属的超级AI模型?甚至,一群人是否还要研发一个用于监督另一群人的AI模型?这会不会形成一个监督嵌套或者监督黑洞?


本文为节选

完整作品请阅读当期杂志


往期推荐

【新锐】《鬼针草》| 王小白

【新锐】《上山》| 蒋临

【叙事】《去丁家湾》| 程永刚


- END -


排版| 刘欠欠


审核| 阮雪芳


核发| 朱铁军


社长/总编辑|朱铁军

副总编辑|阮雪芳

责任编辑|刘欠欠  王寒

美术编辑|卢天豹

国内刊号:CN44-1026/I

国际刊号:ISSN 1003-6881

邮发代号:46-100

投稿邮箱:

tequwenxue@163.com


特区文学
《特区文学》杂志官方公众号
 最新文章