全网首发 | 精解及中译本：欧洲EDPB关于人工智能模型数据保护的意见

学术 2024-12-19 00:01 上海

整理：何渊，DPOHUB主理人

欧洲EDPB关于人工智能模型数据保护的意见

精解

一、基本信息

发布主体：欧洲数据保护委员会（EDPB）。
发布时间：2024 年 12 月 17 日。

二、出台背景

随着人工智能技术的迅猛发展，其在众多领域的广泛应用引发了一系列数据保护相关问题。人工智能模型在处理个人数据时，如何确保数据主体的权利得到充分保护成为关键议题。在此背景下，爱尔兰监管机构于 2024 年 9 月 4 日依据《通用数据保护条例》（GDPR）第 64 (2) 条，请求 EDPB 就人工智能模型开发和部署过程中个人数据处理的关键问题发表意见。此次请求旨在达成对相关问题的共识，确保 GDPR 在人工智能领域的一致适用，维护数据主体的基本权利，促进人工智能技术在合法合规框架内的创新发展。

三、核心内容要点

（一）AI 模型匿名性评估

判定标准

使用个人数据训练的 AI 模型不能简单认定为匿名。其匿名性需综合评估，关键在于个人数据被直接（包括概率性）提取或通过查询获取的可能性是否极小，同时要考量控制者或其他人 “合理可能使用的所有手段”。
监管机构应依据 WP29 意见 05/2014 等相关准则，审查控制者提供的文件，如模型设计文档、数据处理记录等，判断模型是否满足匿名条件。若模型存在可提取个人数据的风险，或输出与训练数据相关的个人信息，则不能认定为匿名。

影响因素

训练数据、模型和训练过程的特征，如数据独特性、模型复杂度和训练方法等，会影响识别风险。例如，数据过于敏感或模型缺乏有效的隐私保护机制，可能导致识别风险增加。
AI 模型发布和处理的上下文，包括访问限制、安全措施等，以及可获取的额外识别信息、获取成本和时间、处理时的技术水平等，均在评估范围内。例如，若模型可被广泛公开访问且缺乏安全防护，识别风险将升高。

（二）正当利益作为法律依据的评估

三步测试法

确定正当利益：利益需合法、清晰精确阐述且真实当前存在。例如，开发辅助用户的对话代理服务或检测欺诈的 AI 系统等可视为正当利益，但需具体情况具体分析。
分析处理必要性：处理应是实现正当利益的必要手段，需考虑是否有其他更少侵入性方式，以及处理数据量与利益追求的比例关系。例如，若能用合成数据达到相同效果，则处理个人数据可能不必要。
评估利益平衡：要权衡控制者或第三方的正当利益与数据主体的利益及基本权利自由。数据主体在开发和部署阶段有多种权益，如对个人数据的控制权、财务利益等，同时基本权利如隐私、言论自由等也需保障。例如，若 AI 模型处理可能侵犯数据主体隐私，即使有正当利益，也可能不被允许。

数据主体合理期望的作用

数据主体的合理期望在平衡测试中关键。其受数据公开性、与控制者关系、服务性质、数据收集上下文、来源隐私设置、模型用途及数据主体对数据在线的意识等因素影响。例如，用户在不同场景下对数据处理期望不同，控制者应提供足够信息帮助形成合理期望，避免因期望不符导致处理争议。

（三）非法处理对后续处理的影响

场景一：同一控制者处理

若控制者非法处理个人数据开发模型且数据保留，后续同一控制者处理时，监管机构可干预初始处理，纠正措施可能影响后续处理。例如，监管机构可责令删除非法数据，使后续处理无法使用这些数据。
开发与部署阶段目的关系及初始处理非法性在正当利益评估中的考量等因素，会影响后续处理合法性。例如，若初始非法处理使数据主体风险增加或期望不符，后续处理合法性受质疑。

场景二：另一控制者处理

确定不同控制者角色及责任是关键。最初和后续控制者都要确保处理合法性，监管机构评估两者行为，包括数据来源合法性审查等。例如，若初始控制者非法获取数据，后续控制者未审查就使用，可能承担连带责任。
初始处理非法性对后续处理影响逐案评估，涉及后续控制者对模型开发合法性评估、数据主体潜在风险评估及平衡测试中技术和法律因素考量等。例如，后续控制者需评估模型是否侵权，在正当利益评估中考虑初始非法处理带来的数据主体风险。

场景三：模型匿名化后处理

若模型匿名化后后续操作不涉个人数据处理，GDPR 可能不适用，但监管机构要严格评估匿名性。例如，若模型存在潜在个人数据提取风险，仍受 GDPR 约束。
若部署阶段处理新收集个人数据，其合法性不受初始处理非法性影响，但初始处理仍受监管机构干预。例如，后续合法处理不改变初始非法处理应受的监管，监管机构可要求控制者整改初始问题。

（四）控制者确保合规的措施

模型设计阶段

选择来源：控制者应选择合适的训练数据来源，确保选择标准适当、来源与目的相关且充分，排除不适当来源。例如，开发医疗 AI 模型应选合法可靠的医疗数据源。
数据准备和最小化：考虑使用匿名或假名化数据，实施数据最小化策略，如限制数据量、过滤不相关数据。例如，图像识别模型训练只选必要图像数据，避免过度收集个人信息。
训练方法选择：采用能降低可识别性的方法，如正则化和差分隐私技术。例如，差分隐私可扰动数据保护隐私同时不影响模型性能。
模型输出措施：添加措施降低查询获取训练数据相关个人数据的可能性，如模糊化输出或限制输出详细度。

模型分析与测试

进行文档审计，包括评估所选措施对限制识别可能性的影响，如分析代码审查报告。同时，开展针对多种攻击的结构化测试，如属性和成员推断、数据泄露等测试，确保模型抗攻击能力。例如，定期模拟攻击测试并根据结果改进模型和保护措施。

（五）缓解措施的应用

多种类型措施

技术措施：采取如加密模型等措施，在不影响模型功能前提下增加数据安全性，不导致匿名化且不违反其他 GDPR 义务或必要性测试。
假名化措施：根据情况实施防止基于个人标识符组合数据的措施，但需权衡控制者数据收集需求。例如，研究性模型开发中要谨慎使用假名化措施。
促进权利行使措施：包括在数据收集和使用间设合理时间间隔、提供无条件 “选择退出”、允许数据主体在特定情况下行使删除权、处理数据反刍主张等。例如，金融 AI 模型应允许用户对错误数据记忆提出纠正主张。
透明度措施：发布超 GDPR 要求的信息，采用多种方式告知数据主体，如媒体宣传、电子邮件、可视化、模型卡等，增强数据主体对处理活动的理解。例如，金融机构的 AI 模型应详细说明数据使用情况。

措施实施与评估

缓解措施应根据具体情况定制，监管机构逐案评估其实施和效果，确保符合 AI 模型特点、处理目的和数据主体权益保护要求。例如，监管机构审查措施是否有效降低风险，是否存在过度或不足情况。

（六）监管机构的权力与职责

监管机构负责监测 GDPR 应用，评估 AI 模型处理个人数据的合法性。享有酌处权，可根据侵权情况选择适当、必要和相称的措施，如纠正措施包括罚款、限制处理、删除数据或模型等，同时要考虑数据主体风险、侵权严重程度、措施可行性和数据量等因素。此外，监管机构的措施不妨碍其他法律框架下的行动，且要确保数据主体能依据 GDPR 行使权利，如请求删除非法处理的数据等。

以下是中译本全文（完整版）：

🌹如需中译本（文字版）和原文（PDF版），请在文末加入DPOHUB开放社区领取！

全部AI及数据中译本及资讯请加入

数据法盟

何渊老师主理的数据法盟DPOHUB：一个只关注数据隐私和数据安全的数据合规权威平台；一个整合法律、技术及媒体的专业数据法生态体；一个制造干货、相互赋能及塑造职业品牌的数据法共同体。合作官微：heguilvshi

最新文章

段永平与巴菲特谈投资苹果股票

纽约法官维持对特朗普的定罪（判决书中译本全文）

重磅！《国家数据基础设施建设指引》发布

美国商务部发布2024年度出口管制执法报告

重磅！国家网信办《个人信息出境个人信息保护认证办法》公开征求意见

全面制裁中国！美国商务部拟制定无人机供应链安全规则

首批：最高人民法院发布重大涉外案例（附全文）

阿里招聘国际合规专家

8天！5家律所、4名律师被罚

文字实录 | 国家数据局“关于推动数据产业高质量发展和促进企业数据资源开发利用”专题会

最新！国家发展改革委等部门关于促进数据产业高质量发展的指导意见

译文｜特朗普的TikTok 案法庭之友文件

吉利汽车招聘国际法务

“数据脱钩”落地：美国发布禁止敏感个人数据向中国跨境传输的最终规则

报名 | 欧盟《人工智能法》的实施落地专题会暨《AIA合规手册》新书发布会 | DPOHUB智享会第18期：线上线下同步

上海大消息！医学人工智能工作方案来了！

报名 | DPOHUB智享会第18期：欧盟《人工智能法》的实施落地专题会暨《AIA合规手册》新书发布会 | 线上线下同步

国家数据局等5部门《关于促进企业数据资源开发利用的意见》

首个 | 《福建省个人信息出境标准合同备案实施办法》

国家数据局官网亮相！领导团队、职能、内设机构公示

中国首份反禁诉令(AASI)裁定书 | 最高法“华为vs美国网件”案

欧盟法院就一员工个人数据跨境转移案件作出裁决

国家审计署通报“利用政务数据牟利”整改情况

报名 | DPOHUB智享会第18期：欧盟《人工智能法》的实施落地专题会暨《AIA合规手册》新书发布会 | 线上线下同步

突发！全国人大法工委：新公司法第88条“出资责任条款”不溯及既往

中方决定对加拿大机构及人员反制！

首家数据科技央企成立，注册资金高达100亿！国家释放了什么重要信号？

美国为什么要禁用大疆无人机和TP-Link

OpenAI被意大利罚款1500万欧元：数据六宗罪？

突然爆雷！知名平台被立案

恶意阻碍上市索赔2300万｜最高法二审判决书

江苏证监局又对一家律所出具警示函

全国网安标委发布《一键停止收集车外数据指引》

全网首发 | 精解及中译本：欧洲EDPB关于人工智能模型数据保护的意见

耶鲁观察：人工智能违法时，谁该承担责任？

因“脸书”个人数据泄露事件，Meta被处罚19亿元

“尴尬，拿了公共数据授权，但卡在运营”

某数据局公开转让1.08亿数字资产，或已被叫停

收藏版 | 国家数据局五大司局和23省级数据局介绍！

独家 | 政府卖数据，屡屡被叫停

附草案全文 | 国务院审议通过《公共安全视频图像信息系统管理条例（草案）》

中联重科招聘法务部副部长

中止！全国首例低空经济特许戛然叫停

郑州两公司被网信办处罚：因网站停用后未采取网安防护措施

“萝卜快跑”被擅自注册为企业名称，法院认定“傍名牌”构成不正当竞争

美国议员公开信：为何现在是对各州人工智能立法采取行动的时候？

AI顶会MIT教授侮辱中国学生“不诚实”！AI大佬集体痛斥，道歉信来了

一文读懂：生成式人工智能对数据治理的影响

中译本全文 | 美国上诉法院驳回Tiktok提出的在最高法院裁决期间暂停执行禁令的紧急动议

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉