OpenAI华人科学家翁荔：多人标注数据减少AI偏见

文摘 2024-11-30 19:05 北京

▲关注中国信息化周报

新视界、新思维、新洞察

ChatGPT横空出世以来，AI技术如同搭乘了高速列车，以前所未有的速度渗透至人类社会的各个角落，深刻影响着我们的生活和工作方式。然而，随着AI技术的不断进步，如何确保这些智能系统既安全又可靠，成为全球关注的焦点。

如何培育出既聪明又安全的人工智能？近日，OpenAI华人科学家翁荔在BiliBili超级科学晚会上表示，AI的进化需要我们用心引导与教育，以确保其更好地服务于人类，同时确保安全。

AI的双刃剑效应

翁荔指出，AI技术如同一把双刃剑，它带来的便利与挑战并行。一个既安全又智能的AI无疑将为我们的生活带来诸多裨益。智能家居系统通过学习用户的习惯和偏好，为用户提供个性化的舒适体验。AI助手通过持续监测用户的健康状况，提供量身定制的健康建议。AI还能提升工作场所的效率，催生新的就业领域。然而，这一切均建立在AI安全的基础之上。正如自动驾驶技术一样，一旦出错，后果可能不堪设想。

随着人工智能技术的快速发展，如何确保AI的行为符合人类价值观并真正实现以人为本，已成为AI安全与对齐研究的核心议题。

翁荔表示，在成长过程中，人类会不断学习进步，但也会遇到成长的烦恼，AI同样如此。它可能会因为数据偏见而变得狭隘，也可能因为对抗性攻击而被恶意利用。以健康领域为例，由于许多疾病研究数据以男性为主，导致AI在处理女性健康问题时风险评估可能存在不准确性。美国性与性别医学专家艾莉森·J·麦格雷戈，就曾在其医疗科普类作品《性别攸关》中指出，女性心脏病症状更容易被归结成焦虑等心理问题，从而造成诊断遗漏。

为应对数据偏见和对抗性攻击的双重挑战，加强AI安全和对齐研究至关重要。AI的智能和可靠性依赖于其学习的数据，“数据是AI的食物”。翁荔认为，提供多样化、全面且准确的数据，是确保AI正确理解世界并减少偏差的关键。简而言之，必须确保AI“营养均衡”，以促进其智能和可靠性的发展。

给AI带上紧箍咒

翁荔提到，在使用人类标注的数据时，可以依赖于群体智慧，即通过多人标注同一数据点来减少偏见和错误，以提高AI模型训练数据的质量。

基于人类反馈的强化学习，是向AI提供高质量标注数据的关键技术。强化学习是一种机器学习方法，通过奖惩机制训练AI完成任务，类似于训练小狗，通过不断的尝试并得到反馈，找到最佳的行动策略。

此外，翁荔表示，为AI制定详细的行为规则，让模型自我评价是否遵循了人类的价值观和行为准则，也能提升AI的输出质量。比如，在文档写作和视频音乐制作中，普通人可以通过设定背景、角色思想和关键词，引导AI创作出既丰富又富有感染力的作品。

就像孙悟空戴着紧箍咒，翁荔表示，AI也要戴上紧箍咒。要教会AI安全基本准则和道德标准，让其遵守行为规范，以人类利益为先。

扩展性监督在AI对齐研究中也非常重要，需要结合自动化工具和人类监督，确保AI朝着正确的方向发展。

翁荔呼吁，AI的安全不仅仅是研究者的责任，它需要每一个人的参与。我们每个人都应该成为AI的大家长，不仅监督和反馈AI的表现，还要参与塑造一个安全可信的AI世界。

备受争议的OpenAI

OpenAI作为人工智能领域的先驱之一，其发展过程中遭遇了不少安全和伦理争议。

OpenAI在创立时定位为非营利组织，致力于“确保人工智能造福全人类”。但随着ChatGPT的流行，公司内部出现分歧，特别是关于“有效加速主义”与“超级对齐”的理念冲突。“超级对齐”团队的成立愿景是用技术规范AI，但随着两位“主心骨”———OpenAI联合创始人、首席科学家IlyaSutskever和JanLeike先后离职，该团队随之解散。Leike表示，OpenAI代表全人类，肩负着巨大的责任，但在过去几年里，安全文化和流程已经让位于闪亮的产品。

此外，OpenAI的发展还伴随着隐私与数据保护问题、版权问题，以及声音模仿争议。

2023年3月，OpenAI因收集和保存用户隐私问题被意大利封禁。2023年12月，《纽约时报》起诉OpenAI和微软侵犯版权，指控其基于数百万篇媒体报道内容进行模型训练，并利用这些内容解答用户提问。2024年5月，OpenAI推出的GPT-4o大模型中，一个名为“Sky”的语音模式与美国女演员斯嘉丽·约翰逊的声音相似，引发争议。

今年6月，13位前沿人工智能公司（OpenAI、谷歌DeepMind、Anthropic）的现任和前任员工共同发表公开信———《对先进人工智能发出警告的权利》，警告先进人工智能的危险，指出人工智能公司优先考虑经济利益、逃避监管。公开信强调：“人工智能公司有强大的财务动机来避免有效的监管。”

从OpenAI的发展历史来看，要实现AI安全，不仅需要给AI技术带上紧箍咒，AI企业同样需要被有效地监管以确保其健康、有序地发展。

作者：于帆

编辑：高珊珊

监制：刘晶

—End—

注：转载、添加白名单以及商务合作请在公众号后台留言，未经许可、不得转载，不得随意修改及盗用原文。

中国信息化周报

《中国信息化周报》与中国信息主管网联动，围绕政府、制造、金融、医疗、教育等行业内容，面向信息化建设领域，报道信息化建设中的新需求、新应用、新体验，为各级工业和信息化主管部门的决策者、企事业单位信息化建设的管理者提供全方位、多元化服务。

最新文章

中央经济工作会议点题 “人工智能+”与未来产业

广汽发布飞行汽车，将搭载自研全固态电池；四款iPhone更新系统后续航降低丨本周热点

AI重塑软件园未来，2024软件产业十大事件揭晓

中国星网发射成功揭秘中国版“星链”

开源四年昇思占新增市场30%

制造业场景数字化转型国家标准正式立项

73项！2024年先进计算赋能新质生产力典型应用案例名单公布

原材料工业标准升级版要来了！瞄准石化、钢铁、建材、黄金等行业

工信部：成立部人工智能标准化技术委员会负责大模型等行标制订（附委员名单）

后ChatGPT时代大模型如何改变世界

35个！2024年国家先进制造业集群名单公布

低空高飞把握超级市场机遇

特斯拉发布第三季财报：中国市场将成为特斯拉销量增长关键

@所有人 2024“鼎信杯”信息技术发展论坛报名正式开启！

余承东：华为Mate70系列芯片100%国产；英伟达回应中国反垄断立案：凭借实力取胜丨本周热点

第三届“鼎信杯”大赛获奖名单公示

见证历史！中国芯片出口迎来里程碑

从中央经济工作会议看2025年中国经济着力点

工信部公示人工智能赋能新型工业化典型应用案例（附表）

国家数据局部署2025年数据系统投资重点任务

个人信息流通安全如何保障

Sora正式上线！视频生成的“纯元”来了

Agent革新人机交互范式

浴火重生的巴黎圣母院，如何利用数字化技术“修旧如旧”

AI搜索领域“变天” 纳米搜索行业突围

第十四届“中国软件杯”大学生软件设计大赛赛题原型开始征集！

英伟达第三季度营收同比增长约94% 黄仁勋：Blackwell芯片已全面投入生产

工信部正谋划新一轮装备制造业稳增长政策；我国车载芯片9成靠进口丨本周热点

“一核四极多点” 中原河南“算”出一个新高地

安世亚太副总裁田锋：仿真技术对企业的智能化进程至关重要

卡奥斯工业智能研究院院长秦承刚：天智工业大模型九大应用案例

微信“减肥瘦身” 轻应用成趋势

产业巨头竞逐固态电池高地商业化进程面临哪些挑战？

AI聚力中国电信加快科技成果产业化应用

16个城市入选！工信部通报2024年度5G应用“扬帆”行动重点城市→

沈向洋对话黄仁勋：聚焦人工智能、算力发展以及未来的变革方向

上海新迪数字董事长叶修梓：设计软件是推动创新变革的“工业母机”

欢迎订阅 | 工信部机关刊《新型工业化》2025年度征订火热进行中！

加速工业软件本地化！破局智能制造“关键一招”

湖南麒麟信安副总裁王攀：我国工业操作系统正迎来前所未有的发展机遇

美提出针对中国的人工智能曼哈顿计划；华为明年初量产新AI芯片丨本周热点

OpenAI华人科学家翁荔：多人标注数据减少AI偏见

中国工程院院士倪光南：与世界协同，为RISC-V生态繁荣贡献中国智慧

光伏头部企业出海德国投资均超40亿元

我国加快推进算力技术标准化建设

中国科学院院士何积丰：普通人如何驾驭AI巨浪

第二届“数信杯”数据安全大赛数据安全积分争夺赛总决赛在河北唐山顺利举办

全国首例！低空经济30年特许经营权，9.24亿元成交！

码垛机器人的大规模商用之路

中国工程院院士桂卫华：“大模型+工业软件”赋能新型工业化

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉