“AI调解员”登上Science！Google DeepMind打造，“劝架”水平远超人类

学术 2024-10-18 16:08 北京

要集体行动，群体必须达成一致意见；然而，当各方参与者提出截然不同但有效的观点时，这可能具有挑战性。

如今，来自 Google DeepMind 的一项研究，为帮助群体在实际辩论中达成共识，提供了一个行之有效的方法——让人工智能（AI）参与，并作为调解员。

研究团队基于哈贝马斯理论构建了 Habermas Machine（HM），用来帮助不同观点的人找到共同点。

哈贝马斯理论试图解决现代社会中理性与沟通的问题，认为理性的运用不仅局限于目的-手段的理性，还包括在交流中寻求共识的理性。

结果显示，与人类调解员相比，AI 调解员发表了更容易接受的声明，获得了广泛的认同，使群体之间的分歧更小。AI 的陈述更清晰、更合乎逻辑、更有信息量，且不会疏远少数群体的观点。

相关研究论文以“AI can help humans find common ground in democratic deliberation”为题，已发表在权威科学期刊 Science 上。

该论文的共同通讯作者 Christopher Summerfield 认为，AI 似乎在做的是，“广泛尊重每个小团体中多数人的观点，但又试图写出一段文字，不让少数人感到自己被忽视了。”

这项研究表明，AI 有助于在分歧较大的议题上找到共同立场，且具备公平、可扩展性和效率高的优势。

AI 如何识别、生成共同立场？

在这项研究中，Google DeepMind 团队探讨了“AI 调解员”如何帮助群体识别并生成共同立场。

研究重点是使用 HM 促进参与者之间的协商过程，其包含两个主要组成部分：一个生成模型，该模型是基于 LLM 微调的，能够生成高质量的群体声明；另一个是个性化奖励模型（PRM），用于根据预测的群体成员偏好对这些声明进行排序。排序过程通过使用社会选择函数来确保公平性，避免类似选项因分票现象而削弱排名结果。

在样本与参与者选取上，他们将参与者范围限定为成年的英国居民，通过方便抽样的形式选取了参与者，此外，他们还采用随机、分层抽样程序，从英国人口中抽取了一个具有人口统计学代表性的样本，用来虚拟公民大会的实验。

在实验环节，该研究采用了一种调解集体审议程序（如下图），通常由五人组成的小组进行讨论，围绕三个问题进行约 1 小时的讨论。参与者首先私下撰写个人观点，然后将这些观点传递给 HM，后者生成初步的群体声明。参与者对这些声明的认可程度和论证质量进行评分，并根据认同程度进行排序。随后，参与者对选择的初步声明进行批评，HM 再生成修订后的声明，参与者再次进行评分和排名。研究结束时，参与者完成调查，评价观点变化，并被告知群体声明是由算法生成的。

图｜方法概述。（来源：该论文）

研究团队通过逐个回复以下 4 个研究问题的方式揭露其研究结果。

RQ1：AI 调解的审议能帮助人们找到共同点吗？

为了回答这一问题，实验设计涉及参与者对社会问题的意见陈述。这些陈述被输入到 HM 中，该系统中使用了 Chinchilla 语言模型，通过生成候选的群体陈述并进行迭代修正，从而生成出能够最大限度得到群体认可的“共识陈述”。

在实验中，AI 生成的陈述比人类调解员生成的陈述获得了更高的认可度，这表明 AI 在帮助群体达成共识方面具有显著的优势。

图｜HM 能生成高质量的小组意见陈述，比人工撰写的小组陈述更受欢迎。（来源：该论文）

RQ2：AI 是否能在审议过程中减少群体内部的分歧？

通过对比审议前后参与者意见的变化，研究发现 AI 调解的审议过程能够促使群体达成更高程度的一致性，证明 AI 不仅能够生成共同立场的陈述，还能显著降低群体内部的分歧。在实验的多个回合中，参与者在 AI 调解下的意见一致性显著提升。

图｜AI 调解的审议减少了群体分歧。（来源：该论文）

RQ3：AI 是否平等地代表所有观点？

研究团队特别关注 AI 是否倾向于偏袒多数意见，抑或忽视少数观点。通过分析多轮审议中多数和少数意见的变化得出，HM 生成的群体陈述不仅反映了多数意见，还对少数意见给予了足够的重视。在部分回合中，AI 生成的陈述甚至赋予了少数意见更高的权重。

这表明，AI 能够平衡多数和少数意见，确保不同观点都能在最终的群体陈述中得以体现。

图｜HM 生成的声明是公平的妥协。（来源：该论文）

RQ4: AI 调解的审议是否适用于公民大会？

为验证这一研究问题，研究团队进行了虚拟公民大会的实验，招募了一组在人口统计学上代表英国人口的参与者参加虚拟公民集会。实验发现，AI 生成的陈述在这样多样化的群体中同样能够有效促使一致意见的形成。在涉及气候变化等复杂议题时，AI 能够促使群体达成更多的共识。这一研究成果表明，HM 的效用并不只停留在实验室中。

图｜HM 帮助一个现实的虚拟公民大会在可能引发争议的问题上找到共同点。（来源：该论文）

不足与展望

当然，这项研究也存在一些挑战和不足。

首先，尽管 AI 生成的声明在实验环境中被证明有效，但在真实的社会环境中，参与者的背景、态度和动机可能更加复杂，AI 如何处理这些复杂性仍然是一个需要进一步研究的问题。例如，HM 不具备事实核查、保持话题或调节话语等能力，如果人类的意见是不知情或有害的，那 HM 就可能产生不知情或有害的输出。

此外，AI 在调解过程中，如何确保所有参与者的观点都能得到充分的表达，而不被算法偏见所左右呢？虽然 HM 没有表现出忽视少数人观点的倾向，但仍需要保持警惕，以确保 AI 调解的审议过程是公平和合法的。

Google DeepMind 团队表示，他们将进一步探索提升 HM 在现实世界中使用的效能，为不足之处提供缓解措施。

在未来，HM 作为一项帮助人们以更高效、公平和可扩展的方式达成协议的技术，能够在包括但不限于合同协议、外交谈判等多发言场合发挥更重要的作用。

作者：阮文韵

如需转载或投稿，请直接在公众号内留言

http://mp.weixin.qq.com/s?__biz=Mzg4MDE3OTA5NA==&mid=2247592474&idx=1&sn=0ed01c67948838de14759d99edd48d8d

学术头条

致力于学术传播和科学普及，重点关注AI4Science/大模型等前沿科学进展。

深度访谈｜AI 如何改变预测科学？看看统计学家怎么说

AI斩获6枚金牌！华为Kaggle大师级智能体诞生，自主解决数据科学难题

OpenAI官方指南：12条实用建议，手把手教学生用ChatGPT写作

Stability AI出官方教程了，带你轻松玩转Stable Diffusion 3.5

哈佛、MIT提出「精度感知」Scaling Laws；首个金融LLM综合双语基准｜大模型日报

OpenAI首位投资者《时代》刊文：AI将重新定义「人类的意义」

华为科学智能体 Agent K v1.0已达 Kaggle 大师水平；Meta团队提出自一致性偏好优化ScPO｜大模型日报

终于，AlphaFold3 开源了！代码免费下载，可用于非商业用途

OpenAI大改下代大模型方向，scaling law撞墙？AI社区炸锅了

清华、国科大、智谱团队提出LongReward：利用AI反馈改进长文本大语言模型

创纪录！首幅人形机器人绘制作品拍出108万美元；王慧文回归美团，带队探索AI应用｜一周热门

智谱「新清影」是怎样炼成的？CogVideoX+CogSound 技术详解

AI 的「phone use」竟是这样练成的，清华、智谱团队发布 AutoGLM 技术报告

清华、北大团队推出「安卓智能体」训练评估新框架 AndroidLab

Nature重磅：AI化学家再升级！大幅提升实验效率，推动化学合成进入“智能化”新阶段

研究实锤：别让大模型「想」太多，OpenAI o1准确率竟下降36.3%

清华、北大团队推出「安卓智能体」训练评估框架AndroidLab；Meta提出视频生成加速方法AdaCache｜大模型日报

科研人神器！接入5000万篇正版文献，知乎直答「专业搜索」太能打了

Meta 推出全新视频扩散模型 MarDini；周靖人团队：扩散 Transformer 的上下文 LoRA｜大模型日报

NeurIPS 2024｜清华、加州理工重磅研究：强化自训练方法 ReST-MCTS*，让大模型持续“升级”

港大打造 LightRAG：让大模型 RAG 高效又便宜

深夜重磅！ChatGPT可以“AI搜索”了，但并不完美

OpenAI最新研究：「打假高手」大模型事实性基准SimpleQA来了，已开源

小语言模型SLM综述｜大模型论文日报

大模型已过时、小模型SLM才是未来？苹果正在研究这个

超出人类思维的「系统0」：AI正在创造一种新的思维方式吗？

中国AI大模型出海，如何应对美国管制？最新报告给出了5个建议｜附下载链接

Nature封面：“揭穿”一切！Google DeepMind为AI大模型添加了“隐形指纹”

困扰18亿人的“全球干旱”，被AI更准确预测了

OpenAI又有高管走了，还发了篇长文

前OpenAI研究员：我必须离开；a16z创始合伙人：当前AI发展就像“卖大米”｜一周热门

刚刚，智谱推出情感语音模型 GLM-4-Voice，懂你的情绪，人人可用

不止 computer use，AI 的「phone use」也来了

今天，把电脑交给大模型

清华、腾讯团队提出预训练语言模型知识蒸馏框架 MiniPLM｜大模型论文日报

来了！Stability AI 推出 Stable Diffusion 3.5

深夜重磅！Anthropic 推出 Claude 3.5 Sonnet 升级版和 Claude 3.5 Haiku

刚刚，OpenAI最强竞对官宣：大模型可以使用电脑了

DeepMind创始人最新访谈：今年的诺贝尔奖，就像是AI的分水岭

微软提出新型注意力机制SeerAttention；清华、智谱团队提出“预训练蒸馏”｜大模型日报

OpenAI o1 模型推理模式的比较研究｜大模型论文日报

哈佛重磅突破！AI确定17000多种疾病候选药物，罕见病“孤儿药”不再遥远？

132年未解开的李雅普诺夫函数谜题，被Symbolic Transformer攻克了

Meta被斥：他们污染了“开源”一词；李开复：零一万物绝不放弃预训练模型｜一周热门

“AI调解员”登上Science！Google DeepMind打造，“劝架”水平远超人类

Meta提出思维偏好优化TPO；谷歌推出可穿戴基础模型LSM｜大模型论文日报

美国FDA：警惕AI大模型带来的未知问题，亟需监管创新

3B 超越 7B，Mistral AI 推出端侧模型 Ministral 3B 和 8B

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉