2024人工智能合作与治理国际论坛“圆桌对话”: 行业、监管机构和第三方公司在人工智能安全的相互作用

文摘 2024-12-10 22:14 北京

点击蓝字

关注我们

2024年12月3日上午，由清华大学、新加坡国立大学、香港科技大学联合主办的“2024人工智能合作与治理国际论坛”举办了以“行业、监管机构和第三方公司之间的人工智能安全相互作用”为主题的圆桌对话。对话由新加坡政府人工智能验证基金会执行主任沙米克·昆杜（Shameek KUNDU）主持，欧盟《通用人工智能实践准则》副主席尼塔山·拉库马尔（Nitarshan RAJKUMAR），Resaro AI管理合伙人兼首席执行官阿葡丽尔·钱（April CHIN），波士顿咨询公司数字化构建与设计部门（BCG X）工程主管罗宾·韦斯顿（Robin WESTON）作为对话嘉宾参与对话与交流。

圆桌讨论

沙米克·昆杜（Shameek KUNDU）主持圆桌对话

对话关注的第一个问题为，基础模型的安全测试和人工智能商业应用的安全测试之间，是否存在关联性。主持人沙米克·昆杜（Shameek KUNDU）认为两者关联度不大，完全是两回事。过度强调联系性会导致检测机构的双重测试，既要测试模型本身的内在安全性和性能，又要测试该模型在实际使用中的表现特别是与应用场景的互动，这可能导致两个测试都无法取得很好效果。

尼塔山·拉库马尔（Nitarshan RAJKUMAR）提到，模型级别的安全性与应用级别的安全性之间存在区别。就像人们将充电器插入插座时，不会关心供电问题或者其他极端风险，而只关心这个充电器到底能不能正常工作。

阿葡丽尔·钱（April CHIN）将基础模型类比为“微型核反应堆”，把实际应用比作通过“微型核反应堆”来为电灯泡供电。对于基础模型，需要确保其按预期运行，防范各种潜在风险，规避灾难性后果。而对于实际应用，则需要确保其不会在多种文化背景下产生偏见、歧视和不良后果。

罗宾·韦斯顿（Robin WESTON）倾向于认为两者之间的关联度不高，因为基础模型的安全验证对人工智能应用安全的检测是否具有帮助，不得而知。并且在实际应用阶段，如果加入太多检查和防护措施，反而会打破产品开发的连贯性和减缓开发速度，在客观上降低产品质量。

尼塔山·拉库马尔（Nitarshan RAJKUMAR）发言

对话关注的第二个问题为，人工智能商业应用者对于安全测试的关注重点和需求是什么。主持人沙米克·昆杜（Shameek KUNDU）提到，一些观点认为，应用者通过测试可以明确自己能从基础模型中具体获得什么，一些观点则认为，正因为人工智能模型本身是不完全透明的领域，所以应用者需要通过安全测试去构建一个框架来应对可能发生的不确定风险。除此之外，应用者更关注的可能只是是产品落地和有效运行，而非安全问题，因为他们的客户不会太关注基础模型或者前沿技术的安全风险。

尼塔山·拉库马尔（Nitarshan RAJKUMAR）赞同到，对于下游应用者而言，他们更关注的是市场需求和产品销售。对于他们而言，安全问题理论上是国家和社会层面的范畴，应由政府部门和相应机构对此负责，由他们进行评估，保这些技术不会带来巨大风险。当然，应用者也会认为即便自己对此有责任，也不具备相应的能力，无法像监管者那样可以确保这些技术不会被恶意使用。

阿葡丽尔·钱（April CHIN）提到，应用者希望通过安全测试帮助他们和客户建立起对人工智能技术的信任基础。应用者可以借此更好地弥合学术基准和业务基准的差距，同时也能更好地向治理部门和客户证明这个系统足够安全，从而使产品顺利投入使用。

罗宾·韦斯顿（Robin WESTON）以自己工作为例，提到其更专注于为客户提供数字化的解决方案比如构建技术系统，因此大部分精力会花在如何确保系统的正常运行，只有20%的精力会放在基础模型安全性的问题上。

阿葡丽尔·钱（April CHIN）发言

对话关注的第三个问题为，如何更好地消除降低人工智能特别是生成式AI所带来的风险。主持人沙米克·昆杜（Shameek KUNDU）认为，可以通过在标准基础上的第三方认证，发放类似电气设备的认证标志，确保模型的安全性和可靠性。这种认证不仅能增加模型使用者的信任，还能确保在使用过程中不会出现重大风险。此外，还可以在安全测试阶段针对重点风险如错误信息和虚假信息等进行测试，减少其被滥用的风险。

尼塔山·拉库马尔（Nitarshan RAJKUMAR）认为，值得肯定的是现在对于安全问题的关注越来越大，很多像自己这样的技术专家正在逐渐将关注点转移到政策和治理领域。目前来看，提高安全性的关键还在于是否能提高模型的透明度，因为政府和社会能借此更好掌握技术实际发展水平和提前发现大规模风险出现的迹象。但同时，一些看似可行的方法实际上还存在挑战性，比如测试阶段的重点测试对象就很难明确，正如尼塔山·拉库马尔曾一度认为错误信息和虚假信息将是公众最关心的问题和风险，然而结果却并非如此。

阿葡丽尔·钱（April CHIN）提出，关键在于让所有相关方（模型提供者、使用者、监管机构等）在技术生命周期中具有清晰的责任和协议，确保每个环节都能做到风险最小化。不仅是对基础模型本身进行安全性测试，还包括对基础模型在实际应用中的表现进行持续监控和改进，从而确保其在不同情境下都是安全、可靠，且符合法律和伦理要求。

罗宾·韦斯顿（Robin WESTON）表示，人们需要找到一种测试方式，既能保持技术发展速度，又能明确重点风险领域，同时还要考虑到系统延迟的实际情况。此外，确保模型安全不仅在于保证模型本身的安全，还要考虑到边界条件、护栏等与模型进行互动的部分。

罗宾·韦斯顿（Robin WESTON）发言

关于我们

清华大学人工智能国际治理研究院（Institute for AI International Governance, Tsinghua University，THU I-AIIG）是2020年4月由清华大学成立的校级科研机构。依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势，研究院面向人工智能国际治理重大理论问题及政策需求开展研究，致力于提升清华在该领域的全球学术影响力和政策引领作用，为中国积极参与人工智能国际治理提供智力支撑。

新浪微博：@清华大学人工智能国际治理研究院

微信视频号：THU-AIIG

Bilibili：清华大学AIIG

清华大学人工智能国际治理研究院

依托清华大学在人工智能与国际治理方面的已有积累和跨学科优势，面向人工智能国际治理重大理论问题及政策需求开展研究。

最新文章

清华大学人工智能国际治理研究院 2024年度管委会顺利召开

报名丨Risk Sciences系列学术论坛——全球经济不确定性与应对研讨会

孟庆国教授就人工智能监管话题接受《文汇报》采访

你好2025！清华大学人工智能国际治理研究院祝您新年快乐！

2024清华大学人工智能国际治理研究院大事记

制定全球人工智能“游戏规则”，中国不能缺席

【AI治理周报-12月第5周】上海印发《关于人工智能“模塑申城”的实施方案》

梁正教授受邀出席科技伦理与合规发展分论坛

梁正教授受邀出席清华大学“卫生健康事业创新实践研修班”并授课

梁正 | 为什么AI替代不了人类？

万字回顾+全程视频｜2024人工智能合作与治理国际论坛“人工智能安全全体会议”在新加坡成功举办

开班在即丨人工智能国家战略与政策前沿研修班

中国-拉加地区生产力发展政策协同效应研讨论坛成功举办

新华社 | 走好AI时代这三步：更好用、防滥用、求善用

中美科技关系走向：中国对美科技反制措施【AI战略洞察】

国家知识产权局新举措助力科技成果转化【AI知识库】

【AI治理周报-12月第4周】2024年美国联邦人工智能用例达1700余个

梁正教授受邀参加第三届“中欧二轨高级别视频对话会议”并发言

活动预告 | 中国信通院“科技伦理与合规发展”分论坛

清华大学校长李路明率团访问香港科技大学

张亚勤向清华学子分享新时代人工智能的发展方向以及青年在新技术潮流中的学业规划与职业选择

“AI＋创业精英实训营”课程回顾 | 清华大学文科资深教授薛澜揭示人工智能的发展与治理

构建标准体系：人工智能标准化推动中国技术创新与全球竞争力提升【AI战略洞察】

周伯文 | 以通专融合方式构建AGI——路径与关键问题探索

美国计划授权谷歌等科技巨头管制AI芯片出口【AI战略洞察】

清华大学副校长杨斌率团访问新加坡、香港进一步深化教育合作交流

解放日报：中国AI大模型发展前景如何？图灵奖得主姚期智带来“好消息”｜浦江AI学术年会

硅谷+国防？OpenAI与Anduril Industries合作对美国军事技术的影响分析【AI知识库】

【AI治理周报-12月第3周】三季度全球半导体行业收入达1582亿美元同比增长17%

活动预告 | 人工智能驱动未来政府：公民与公务员对人机协作智能政府的观点-公共政策讲堂第7期暨第450期学术人生

前沿人工智能四大优势，开启高效便捷新时代

“数字经济和人工智能领域的国际投资研讨会”在清华大学成功举办

工信部助力人工智能中小企业，推动产业发展壮大【AI战略洞察】

布伦丹·卡尔出任联邦通信委员会主席：对美国AI及科技产业的影响【AI知识库】

前沿人工智能四大优势，开启高效便捷新时代

国家高新区人工智能产业协同创新网络成立:中国AI产业发展的新动力【AI战略洞察】

芯片战争白热化：从英伟达被查说起，中美科技博弈进入深水区【AI战略洞察】

2024人工智能合作与治理国际论坛“人工智能安全”专题论坛在新加坡成功举办

2024人工智能合作与治理国际论坛“圆桌对话”: 行业、监管机构和第三方公司在人工智能安全的相互作用

2024人工智能合作与治理国际论坛，共话AI未来

【AI治理周报-12月第2周】全球人工智能基础设施支出将逐年增加，预计2028年超1000亿美元

2024人工智能合作与治理国际论坛“圆桌对话”: 公共部门与人工智能

2024人工智能合作与治理国际论坛“智能时代的工作与教育”专题论坛成功举办

2024人工智能合作与治理国际论坛“圆桌对话”：人工智能赋能可持续发展

2024人工智能合作与治理国际论坛“圆桌对话”：人工智能与法律

2024人工智能合作与治理国际论坛“圆桌对话”：人工智能治理的国际合作

2024人工智能合作与治理国际论坛“圆桌对话”: 人工智能安全的科学研究

2024人工智能合作与治理国际论坛“人工智能伦理与治理”专题论坛在新加坡成功举办

2024人工智能合作与治理国际论坛“人工智能产业发展与治理”专题论坛在新加坡国立大学成功举办

2024 人工智能合作与治理国际论坛在新加坡国立大学开幕

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉