首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
深度解读!什么是隐私计算?有何应用及进展?
时事
2024-10-30 11:41
北京
李凤华
中国科学院信息工程研究所研究员、技术副总师
随着互联网、物联网、云计算、大数据、人工智能等技术的演进和推广应用,新业态不断涌现,服务过程所产生和沉淀的海量数据成为国家基础性战略资源,是赋能行业数字化转型和智能化升级的重要支撑,并成为推动数字经济发展的核心引擎。习近平总书记强调,“要维护国家数据安全,保护个人信息和商业秘密,促进数据高效流通使用、赋能实体经济,统筹推进数据产权、流通交易、收益分配、安全治理,加快构建数据基础制度体系”。我们要深入贯彻落实习近平总书记重要论述,统筹推进数据资源开发利用和安全治理,不断完善数据安全治理制度,促进数字经济持续健康安全发展。
传统的数据安全和隐私保护技术不能解决数据流通利用过程中跨系统的个人信息全生命周期保护问题,隐私计算(Privacy Computing)的理论体系被适时提出。本文聚焦隐私计算的内涵及其应用实践,阐明隐私计算在个人信息保护和数据流通利用中的支撑作用。
隐私计算的概念和内涵
隐私是敏感个人信息,针对特定场景有许多隐私保护方法,但是缺乏全生命周期的体系化理论和技术支撑,严重制约数据泛在共享、数据流通利用。为此,我们从“计算”角度研究全生命周期的隐私计算理论体系,构建全生命周期隐私保护的统一模型。
第一,隐私计算的定义与内涵。
我们提出隐私计算的定义是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄露代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统,涵盖信息搜集者、发布者和使用者在信息产生、感知、发布、传播、存储、处理、使用、销毁等全生命周期过程的所有计算操作,并包含支持海量用户、高并发、高效能隐私保护的系统设计理论与架构。
隐私信息全生命周期过程的计算环节包括收集、脱敏、存储、使用、交换、删除、存证与取证等,这些环节在多个信息系统之间不同的业务流程组合可以涵盖隐私信息全生命周期的操作过程。其中,“收集”对应隐私计算定义的“产生”和“感知”,“交换”对应隐私计算定义的“发布”和“传播”,“脱敏”对应隐私计算定义的“处理”,“删除”对应隐私计算定义的“销毁”等。
第二,隐私计算通用框架。
隐私计算通用框架
隐私计算通用框架包括隐私信息抽取与度量、隐私度量动态调整、隐私延伸控制、隐私按需保护、保护效果评估、存证与取证等功能组件。隐私信息抽取与度量通过对采集或接收的信息进行分析,提取不同模态信息中的隐私信息分量,并对隐私信息分量进行分类以及量化隐私信息分量的敏感度或保护程度。隐私度量动态调整通过识别判断隐私信息所属的应用场景,对隐私信息分量的敏感度或保护程度进行针对性的度量调整。隐私延伸控制在数据泛在流通与共享过程中,对全生命周期各环节的隐私操作进行迭代控制。隐私按需保护约束隐私信息处理者根据延伸控制策略,对接收到的隐私信息进行按需脱敏、按需删除等处理,提供场景自适应的隐私保护能力。保护效果评估根据制定的脱敏效果评估指标体系,对待评估的已脱敏隐私信息的脱敏效果进行量化分析,如未能达到预期效果,则分别视情况从隐私信息抽取与度量、隐私度量动态调整、隐私延伸控制、隐私按需保护等环节进行反馈迭代,直至达到期望的保护效果。存证与取证对隐私信息抽取与度量、隐私度量动态调整、隐私延伸控制、隐私按需保护、保护效果评估等功能组件的操作行为进行日志记录,支撑隐私侵权行为溯源取证。
第三,隐私计算所解决的问题。
一是跨系统的全生命周期保护,提出了隐私信息全生命周期过程的计算操作;二是迭代延伸控制,延伸控制策略由信息主体的控制意图、当前使用者的控制约束和数据接收者的防护能力生成,同一控制策略在全生命周期中体现迭代调整;三是差异化按需保护,同一信息在同一应用场景的不同阶段以及在不同应用场景下保护粒度差异化;四是基于保护效果评估反馈的保护自适应改进,通过保护效果评估动态调整脱敏算法及其参数、删除方法选择等,减少因隐私信息保护控制策略长期不变而导致隐私泄露;五是隐私侵权行为溯源取证,对隐私信息全生命周期各环节的操作行为进行自存证,存证信息与信息不可分离地一起流通,支撑泛在、随遇、实时的全生命周期隐私信息有序合规利用。
值得注意的是,国内一些机构或个人在翻译国外文档时,将隐私增强技术和隐私保护计算翻译成隐私计算或隐私计算技术,将机密计算、密文计算、安全多方计算、联邦学习等都谬称为隐私计算,此举不仅混淆了隐私计算的概念和内涵,还误导决策者、企业等,导致企业因使用谬误的隐私计算而没有达到隐私保护效果。
不同安全技术的差异
要做好个人信息保护,重点是正确利用不同技术解决流通利用过程中不同环节的数据安全与隐私保护问题,要正确理解不同技术所能解决的问题,在不同环节选取合适的技术方案。
第一,隐私计算技术。
隐私保护是个人信息在流通利用过程中进行脱敏,使信息产生偏差或去标识化,支撑个人信息的出域保护。传统的k-匿名、差分隐私等隐私保护技术只能解决单一环节、单一场景的隐私保护,隐私计算则是面向隐私信息流通利用、跨域受控共享等应用需求,采用隐私度量动态调整、按需脱敏控制、迭代延伸控制、保护效果评估等技术措施,解决差异化脱敏、脱敏效果评估、数据交易的差异化定价与脱敏、多轮交易价格差异化联动、隐私传播控制、跨域隐私延伸控制等问题,实现隐私信息全生命周期保护,支撑隐私信息合规的流通利用。
第二,联邦学习技术。
联邦学习的多方利用自身数据完成部分的模型训练,中心节点完成模型汇集,是一种分布式的机器学习架构。合作方之间交换训练中间结果和模型参数,而不交换数据本身,自然而然地不存在数据出域而导致的原始数据泄露,但中间结果的交换没有防泄露的机制,仍然存在部分数据泄露的问题。
第三,密文计算等技术。
数据安全是接收者收到的信息与提供者发送的信息相一致,防止对数据的非授权获取和篡改,关注的是机密性、完整性、不可否认性等。当前被广泛提及的密文计算、机密计算、安全多方计算等都是数据安全技术。
面向数据利用的多方信息出域且计算环境不可控的场景,在进行联合计算、统计分析、利用算力设施外包计算、密文数据检索等过程中,密文计算采用密文数据出域且明文数据不出域的方式,参与方在密文上计算,从而保护参与方参与运算的原始数据,并安全分享计算结果,支撑数据出域计算时原始数据的安全性防护和数据加密时的统计查询等。密文计算所解决的问题是外包计算场景的数据保护,参与运算的明文及明文结果都没有信息损失,可用于计算过程中的数据保护。密文计算的普适性弱、算力需求大。
针对在算力设施中安全处理敏感数据和个人隐私的问题,机密计算将个人隐私或敏感数据隔离在被称为可信执行环境(TEE)的受保护区域中,并在可信执行环境内处理数据。机密计算所解决的问题包括:一是计算环境的可信性,通过执行环境隔离,提供可信执行空间,未授权参与方不能进入该空间;二是计算环境的可控性,参与主体能监控该环境中数据使用的合规性;三是计算环境的机密性,参与主体不能窥探到在该环境内的数据、代码和操作,但可获取计算结果。机密计算的普适性好,但仍然存在跨TEE的安全性问题。
在数据利用的多方信息安全共享过程中,针对数据提供者未分享的原始数据不出域需求,安全多方计算采用不经意传输(Oblivious Transfer)、秘密分享、混淆电路(Garbled Circuit)、同态加密(Homomorphic Encryption)等密码技术,通过多轮信息秘密交换的数据安全计算,实现数据计算或交换过程中未分享的原始数据不出域,支撑计算结果安全共享。安全多方计算所解决的问题:一是保护消息接收者的意图,接收者在获取自己想得到的信息的同时,保护了自己的真实意图;二是未分享的原始数据不出域,通过多轮信息秘密交换的数据安全处理,保护了在计算或交换过程中参与方未分享的原始数据。安全多方计算的普适性弱,计算复杂度和通信复杂度高。
不同技术实现“可用不可见”存在差异。数据流通利用中“不可见”是指参与运算的原始数据不能以明文的形式出域,或者以密文形式出域的情况下必须保持密文运算,即参与运算的各方不能以任何方式获取原始数据的明文;“可用”是指参与方可以明文或密文的方式获取运算的结果。“可用不可见”分为域内“可用不可见”和出域“可用不可见”两种场景。密文计算是原始数据出域场景下以密态的形式分享计算结果;安全多方计算是分享需求方所需的原始数据,对需要的原始数据不属于“可用不可见”;联邦学习是原始数据不出域的情况下分享计算结果,但需要安全技术解决模型训练的中间参数传输安全问题,以及模型对数据和隐私的泄露问题;隐私计算以按需脱敏和使用的延伸控制来保障域内和出域场景下的“可用不可见”;机密计算是保障域内场景下的“可用不可见”。
总体而言,个人信息保护分两种:一是数据防泄露;二是隐私保护。国际上提到的隐私保护计算或隐私增强技术关注的是机密计算、密文计算、安全多方计算等,解决的是数据防泄露的问题;隐私计算重点解决数据域内或出域交换情况下全生命周期的隐私保护。
隐私计算的研究进展与应用
第一,隐私计算理论与技术的研究进展。
隐私计算经过近10年的发展已比较成熟。在隐私计算架构方面,在国际上率先提出了隐私计算的概念、定义及学术范畴,提出了面向全生命周期保护的隐私信息描述方法及控制机制,提出了隐私计算通用架构和全流程体系化保护技术,构建了隐私计算的核心基础理论。
在泛在共享延伸控制方面,提出了面向隐私信息跨系统流通的迭代延伸控制、基于证据自存证的隐私侵权行为判定与溯源取证、场景适应的隐私信息差异化脱敏延伸控制和删除延伸控制等方法,解决了动态流通场景下延伸控制策略迭代调整、低开销抗泄露防篡改的存证等技术难点,支撑了跨系统隐私信息受控利用。
在场景适应按需保护方面,提出了差分隐私的算法通用框架,提出了隐私保护算法框架抽象及算法设计、跨场景差异化按需脱敏管理等方法,解决了普适稳定的算法通用框架、场景适应的脱敏管理等技术难点,实现了按需保护。
第二,隐私计算的典型应用。
隐私计算实现隐私信息全生命周期的保护,在数据流通利用中发挥重要的作用。
隐私计算在个人信息保护中的作用。隐私计算可以支撑数据域内和出域场景下个人信息的迭代延伸控制,根据服务的不同阶段或者不同场景实现差异化按需保护,支持跨系统保护的量化映射以实现隐私跨系统保护的一致性,基于保护效果评估反馈实现保护算法和参数的自适应改进。隐私计算的这些优势可以很好地平衡个人信息保护和新型信息服务模式对数据利用的需求,隐私计算的存证与取证还可有效地支撑隐私侵权行为溯源、个人信息保护合规判定。
隐私计算在数据流通利用中的作用。在数据流通利用过程中,基于隐私计算延伸控制的思想实现数据流通控制和使用控制,对于数据要素的多轮交易实施延伸控制;基于隐私计算的按需脱敏支撑数据要素的差异化定价;通过隐私计算的存证与取证支撑数据流通利用过程中的风险识别、预警与争议仲裁等。
第三,隐私计算的技术演进。
全生命周期的保护理念、迭代延伸控制机制、按需脱敏均是隐私计算的核心内涵。隐私计算与安全多方计算、同态加密、机密计算等数据安全技术有明显的边界,也不能与联邦学习、隐私保护计算等混淆,否则不利于原始创新。我们应坚持正确的学术观点,避免张冠李戴、“新瓶装旧酒”,做真正的隐私计算研究,将已经提出40多年的安全多方计算、同态加密等技术包装冒充成“隐私计算”并不能解决个人信息保护的问题;只有采用真正的隐私计算才能保证数据流通利用的全生命周期保护。在隐私计算理论框架已经成熟的情况下,未来需要不断优化延伸控制机制与不同信息系统的融合技术,丰富和完善按需脱敏、按需删除技术,深入研究保护效果的评估技术以更好地支撑按需保护算法和参数的优化调整。
我们要推动隐私计算技术发展和产品应用,保障《中华人民共和国个人信息保护法》的落地实施,支撑我国数字经济的健康发展和行稳致远。
原标题:《隐私计算理论与应用实践》
作者:李凤华系中国科学院信息工程研究所研究员、技术副总师;李晖系西安电子科技大学教授、网络与信息安全学院执行院长; 牛犇系中国科学院信息工程研究所研究员、数据安全研究室副主任
来源:
《中国网信》2024年第10期
投稿:
zhongguowangxin@vip.sina.com
http://mp.weixin.qq.com/s?__biz=MzA5OTA2OTU5Mg==&mid=2651547761&idx=1&sn=5ff18393b515206bfc04cc915ecd1dbe
中国网信杂志
《中国网信》杂志是由中央网信办(国家网信办)主管、中国网络空间研究院主办的全国网信工作指导性刊物。
最新文章
“意公子”吴敏婕:我们赶上了一个好时代
订阅2025年《中国网信》杂志,紧跟信息化发展浪潮!
记者节特辑!来看这些最美工作照
成都市委网信办主任鲜阳红:打造更具韧性的城市安全“生命线”
董煜:新质生产力发展的三个重点方向
毛伟:我们为什么需要中文域名?
一文解读!这家地方媒体如何探索国际传播新路径
刘韵洁院士:做好互联网这一件事
订阅《中国网信》杂志!与时代脉搏同频 共舞数智浪潮
如何开创网络内容建设新局面?央视网这样做
吴建平院士:互联网核心技术要牢牢掌握在自己手里
邬贺铨院士:我们为何能实现3G突破到5G引领
钱华林:中国互联网30年的发展出乎意料
国家互联网信息办公室关于发布第八批深度合成服务算法备案信息的公告
一文速览!最新一周网信资讯
胡启恒院士谈“中国首次全功能接入国际互联网”
新时代网络内容建设如何推进?来看这个案例!
11月1日起,13项网络安全国家标准开始实施
中央网信办部署开展“清朗·同城版块信息内容问题整治”专项行动
“迈向网络新时代”系列重磅嘉宾访谈即将推出!
深度解读!什么是隐私计算?有何应用及进展?
习近平在省部级主要领导干部学习贯彻党的二十届三中全会精神专题研讨班开班式上发表重要讲话
干货!新一轮通用顶级域开放计划的进展及对策
违法违规涉军自媒体账号典型案例
中国工程院院士张平:通信与智能融合——6G迈向“智简”的有效途径
我和网信 | 把论文“写”在大地上的青春力量
@网信人,网信周报新鲜出炉!
《全民数字素养与技能发展水平调查报告(2024)》发布
在这里,走近“大美湿地”
亮点速览!《中国互联网发展报告·网络法治篇(2017—2023)》
黑龙江省委网信办:深入学习贯彻习近平总书记重要指示精神 奋力谱写龙江网信事业高质量发展新篇章
阿里云智能集团如何拥抱人工智能
习近平出席金砖国家领导人第十六次会晤并发表重要讲话
天津市委网信办主任、市数据局局长邓光华:为奋力谱写中国式现代化天津篇章贡献网信力量
武宁县委常委、宣传部部长周雷生:解放思想 “宁”心聚力 以信息化数字化赋能新质生产力发展
北京市委网信办主任张劲林:坚决以首都网信全面深化改革新成效全力服务中国式现代化建设
呼伦贝尔市委网信办副主任刘占民:加强网络综合治理体系建设 切实提高依法管网治网水平
“何以中国·五星出东方”网络主题宣传活动在新疆吐鲁番启动
公安部党委委员、副部长陈思源:严打网络违法犯罪 筑牢网络安全防线 以高水平网络安全保障高质量发展
大国与新时代——写在中华人民共和国成立75周年之际
@网信人,最新网信周报出炉!
《中国网信》2024年第10期目录
米歇尔·杰诺韦塞:关于促进网络空间国际合作的展望
四川广元:夯实网络安全基石 筑牢网络安全防线
贺永祥:立足真融真改 推进深融深改
俞岚:打造新质传播力 全面提升网络国际传播效能
霍春辉 何地:城市全域数字化转型助力数字中国建设
“指尖上的形式主义”全国整治工作会议在京召开
杨珉 潘旭东:建设人工智能安全常态测评机制 促进大模型产业持续智能向善发展
《中国网信》杂志亮相北京市2025年度报刊发行宣传日暨第二届北京邮政文化市集
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉