【未来批评】《主体性和共体性：隐藏在AI里的那个人》| 廖令鹏

文化 2024-07-30 09:36 广东

点击蓝字，关注我们

作者简介

廖令鹏，中国文艺评论家协会会员，深圳文艺评论家协会理事，历届睦邻文学奖评委，在《文艺报》《文学报》《中国文艺评论》《小说评论》《青年文学》等报刊发表评论百余篇，出版批评专著《新城市文学的新语言》，曾获第二届全国青年产业工人文学大奖文学评论奖、深圳青年文学奖、粤港澳大湾区文艺评论奖等多种奖项。

阅读提醒：全篇5152字，本文节选1706字

人类存在的重要价值和意义是什么？

特斯拉创始人马斯克，这个预言AI很快将超越人类智能、AI比最聪明的人还聪明的科技狂人曾经说过一段话，“你可以把人类想象成数字生命的生物引导器。如果你不知道什么是引导器，我可以换一种方式解释，这是一段极短的代码，但没有它，计算机是无法启动的，这就像计算机启动的最小代码，就像硅电路自己无法演化出来一样，它需要生物来启动进化。”

无独有偶，腾讯研究院出版的第62期《互联网前沿》的封面标题赫然写着：“把自己作为AI——超级个性养成参考”。其中一篇文章《把自己作为AI——一次试验得来的四条建议》，就是作者在和GPT4.0经过多轮对话后，总结了GPT4.0对于人类向AI学习的四条参考路径：数据驱动决策、强化逻辑思维、提升识别能力、持续优化自我。

AI需要生物（人）作为引导器来启动进化，与此同时，人也要把自己作为AI的一部分持续进化——前者是马斯克的观点，后者就是AI的建议。在自我进化的冲刺中，AI正在和人类展开激烈的竞赛。既是竞赛，就有起跑线和终点线，就有规则和裁判，“AI价值对齐”，便成为当下探讨的热点话题。

AI进入大模型时代后，各种“类人”“超人”和“模型人”能力持续涌现，其自主性、通用性、理解力快速提升，成为面向未来的新型底层架构。

然而，随着大模型开始像人类一样从事语言理解、内容生成和社会服务任务，开始像Sora等打通文字、音频和视频的界限，广泛出现在人类生活当中，人们面临一个最根本的、颇具挑战的问题：错误或虚假信息，如人工智能虚构事实而出现“幻觉”；算法歧视，特别是在算法自主运行模式下，开发者既无法控制其运行过程，也无法向外界对此进行解释；能力风险，如AI追逐权力、欺骗人类、不服从；滥用问题，如恶意分子通过对抗性输入、“越狱”等方式让大模型与自己同谋。因此，如何让AI大模型的能力和行为跟人类的价值、真实意图和伦理原则相一致，确保人类与AI协作过程中的安全与信任。这个问题被称为“价值对齐”。

怎么实现价值对齐？在这个问题上，人类的技术性和人文性出现分歧，人类的价值特征和群体特征突显出来了。

首先需要明确的是，人类价值是一个复杂且多元的概念，它包含了道德、伦理、文化、社会风俗等多个方面，它并非一成不变，而是随着社会的进步、科技的发展以及个体认知的深化而不断演变。我们要理解对齐的“人类价值”与真正的人类价值之间的差异，尽管AI在处理信息、执行任务和进行决策方面表现出了惊人的能力，但它仍然缺乏对人类情感的深刻理解和体验。即使AI能够遵循一套预设的道德和伦理规范，它也可能无法完全理解和尊重某些人类价值，如尊严、同情和公平等。

此外，人类价值在不同的文化和社会背景下具有多样性，不同的国家和地区、不同的民族和宗教，甚至不同的个体都可能拥有不同的价值观念和道德标准。所以AI在追求与人类价值对齐的过程中，可能会面临难以调和的价值冲突，会经常性地出现人类道德和价值困境，比如在战争决策、医疗决策、基因编辑、自动驾驶等领域，以及伦理学最为知名的思想实验“电车难题”。

我们和AI一起走在大路上。AI只能先解决技术和进化的问题，还没有办法考虑到这些具体的问题，特别是具体的人的问题。对于如何实现价值对齐，工程师探索的一种方法是将人类反馈引入强化学习，这是显而易见的。关键在于另一种方法——监督。这涉及AI治理，业界一直在探索如何借助AI监督，包括AI自我监督、一个AI系统监督另一个AI系统等方法实现AI对齐。

美国的AI大模型公司Anthropic提出“宪法性AI”模式，即从低效的“人类监督”转向更高效的“规模化监督”，比如通过结合自己的实践经验、借鉴世界人权宣言、苹果公司的服务条款、DeepMind 的Sparrow规则（如“禁止聊天机器人假装自己是人类”“不发表威胁言论”和“不发表仇恨或侮辱性言论”等），研发一个从属的AI模型，用于评估主模型的输出是否遵循了特定的“宪法性”原则。规模化监督实际上承认了人类监督的复杂性与脆弱性，而转向了监督的效用，即目标导向，这是可以理解的。

但问题也接踵而来，人类监督在规模化监督中扮演什么角色？谁来监督这个“从属的宪法性AI模型”？人类是否要再研发一个从属的超级AI模型？甚至，一群人是否还要研发一个用于监督另一群人的AI模型？这会不会形成一个监督嵌套或者监督黑洞？

本文为节选

完整作品请阅读当期杂志

点

击

图

片

购

买

往期推荐

【新锐】《鬼针草》| 王小白

【新锐】《上山》| 蒋临

【叙事】《去丁家湾》| 程永刚

- END -

排版| 刘欠欠

审核| 阮雪芳

核发| 朱铁军

社长/总编辑｜朱铁军

副总编辑｜阮雪芳

责任编辑｜刘欠欠王寒

美术编辑｜卢天豹

国内刊号：CN44-1026/I

国际刊号：ISSN 1003-6881

邮发代号：46-100

投稿邮箱：

tequwenxue@163.com

http://mp.weixin.qq.com/s?__biz=MzU5NzQ5NjQ3Mg==&mid=2247496221&idx=1&sn=ab7bd30e7434d109741c7db328fa31f1

特区文学

《特区文学》杂志官方公众号

最新文章

【新锐】《加州曼德拉》| 温凯尔

《加州曼德拉》创作谈

【新锐】《皮格马利翁效应》| 高临阳

《皮格马利翁效应》创作谈

我刊首发作品——肖克凡的《窗外的钥匙》被《小说月报·大字版》转载

【观潮】《向死而生》| 邢庆杰

文学是一剂良药 ——《向死而生》创作谈

【观潮】《微躯何求》| 东紫

来自朋友的馈赠 ——《微躯何求》创作谈

《特区文学》2024年第10期目录

我刊首发作品——须一瓜的《邮差藤小玉》被《小说月报》转载

【未来批评】《“美”的历程》| 郑慧芳

【未来批评】《当我成为飞鼠的妈妈》| 石韫琦

【散文】《文武兼备的岳飞》| 王国猛

【新锐】《白璧》| 肖明明

【新锐】《退休之日》| 废斯人

【新锐】《甘蔗林》| 田兴家

《甘蔗林》创作谈

【新锐】《夜游橘子海》| 王文

【叙事】《父亲的船》| 李浩然

一个人的两重身份——《父亲的船》创作谈

【叙事】《未曾被察觉到的一段思绪》| 王卉子

拨云不见月——《未曾被察觉到的一段思绪》创作谈

【观潮】《茶宠》| 梁豪

《茶宠》创作谈（视频）

《特区文学》2024年第9期目录

【新锐】《跤王》| 李下

【新锐】《事到如今》| 程惠子

我刊首发作品——房伟的《光之湖》被《长江文艺·好小说》转载

【叙事】《礼拜二午睡时刻》| 黄大鹏

我刊首发作品——钟二毛的《与一方砚相遇》获首届“中国砚都杯”肇庆文学奖银奖

【叙事】《白店》| 智啊威

《白店》创作谈

【叙事】《我们一起去熊耳山吧》| 范墩子

我刊首发作品——肖克凡的《窗外的钥匙》被《小说选刊》转载

【叙事】《山茶花》| 海男

《山茶花》创作谈

【观潮】《蒹葭苍苍》| 罗望子

【观潮】《邮差藤小玉》| 须一瓜

《特区文学》2024年第8期目录

《特区文学》荣获“第六届广东省优秀期刊奖”

【未来批评】《AI化人类：浮士德与魔鬼的交易》| 吴可彦

【未来批评】《主体性和共体性：隐藏在AI里的那个人》| 廖令鹏

【新锐】《鬼针草》| 王小白

【新锐】《上山》| 蒋临

《上山》创作谈（视频）

【叙事】《去丁家湾》| 程永刚

藏在心里的光芒 ——《去丁家湾》创作谈

【叙事】《水上乐园》| 水笑莹

走出虚幻的蜃景——《水上乐园》创作谈

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉