首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
专家解读|构建国家数据标准体系,助力数据要素可信流通发展
企业
2024-11-18 16:23
浙江
文|蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算科技有限公司董事长 韦韬
*
文章转载自“全国数标委”微信公号
近期,国家发展改革委、国家数据局等六部门联合印发了《国家数据标准体系建设指南》(以下简称《指南》)。
《指南》以数据“供得出、流得动、用得好、保安全”为指引,构建了涵盖数据基础设施、数据资源、数据技术、数据流通、融合应用及安全保障等模块的国家数据标准体系,有利于指导数据领域关键急需标准的制修订和落地实施,满足数据要素市场快速响应新技术、新模式的发展需求,提升数据标准的适用性和前瞻性,为数据标准化工作提供了基础指引,为数据要素市场指明了规范化建设路径。
相较传统侧重于数据在主体内部进行治理和利用的内循环范式来说,数据要素市场的核心在于构建跨主体、跨行业、跨场景的外循环流通利用。数据要素的外循环释放了数据更深层价值,但也增加了数据的治理难度和流通风险。第一,当数据跨越提供方的域后,存在权属、责任不明晰的情况,导致出现合规、安全保护强度、责任追溯等问题。第二,数据流通链路上的多数企业缺乏全面的数据保护能力,导致数据存在潜藏泄露滥用风险。
在此背景下,建立一个技术信任的可信数据基础设施变得极为关键。不仅可以鼓励跨主体、跨场景、跨行业的数据供应者积极参与,以激发数据要素价值的规模化转换,而且加速了数据要素在高效、安全条件下开展外循环流通利用,确保数据要素价值得到最充分的释放。针对高价值高敏感数据开展数据基础设施试点,可以梳理典范,完善行业准入标准,形成行业指导意见,并催生规模效应,降低边际成本,为数据要素大规模“供得出、流得动、用得好、保安全”提供更有利的环境。
标准作为凝聚产业共识、明晰责权分配、确立行业水位、规范治理要求的产业工具,对于指导数据安全高效进入数据要素可信流通的外循环中具有重要作用。《指南》明确了数据基础设施在数据要素流通利用过程中的基础性和支撑性作用,对于存算设施标准、网络传输标准以及流通利用设施的技术、流程、管控要求标准等建设提出了指导意见,确保数据资源合规高效有序流通。
在这些工作基础上,针对当前比较迫切需要解决的几个产业问题的角度,我们认为受控匿名化、数据跨域管控和数据可信流通安全分级三个方向值得特别关注。
一、可实施的受控匿名化标准是规范个人信息保护与促进数据合规流通利用的“稳定器”
现有的《网络安全法》与《个人信息保护法》引入了专门的“个人信息匿名化条款”,将匿名化后的数据与个人信息进行了区隔,但针对匿名化的法律内涵和实施标准却有待厘清。实践中,这一条款虽已确立却未能充分发挥效用,但匿名化实施以促进数据利用的需求非常迫切。如在大型模型训练的场景下,重新获取个人数据授权用以训练的难度极高。而采用受控匿名化手段处理个人信息,则能在保障人工智能发展所需数据资源的同时,有力保障个人隐私安全。
匿名化最核心的是重标识风险是否可控可忽略。在开放空间中,由于能实施数据的高维关联,无法保证重标识风险的可控可忽略,因此必须在受控的环境中来探讨匿名化方案。受控匿名化能满足匿名化要求的核心原理在于,既然信息被限制到特定环境中,那么考虑攻击威胁及相应的重标识风险的时候,就只需要考虑结合所有可能进入该环境的个人信息可能产生的重标识风险,以及通过各种手段非授权获得该环境中的信息后可能产生的重标识风险,确保结合空间内的所有信息,无法识别特定自然人且不能复原,以及受控环境足够安全,能够防止非授权数据访问和窃取。
因此,制定一套针对受控环境的匿名化实施指标和评估规范等系列标准显得尤为重要。通过建立统一的数据受控匿名化处理流程和方法,详细界定何为足够的数据脱敏程度,不仅可以有效防止敏感信息泄露,而且确保数据在研究、分析及其他非识别性用途中的价值得以保留。
二、支持数据使用权跨域管控的标准是确保数据可信流通的“压舱石”
将来自不同主体、行业的数据进行融合,能够帮助业务构建层次丰富、视角全面的数据画像,为决策提供深度更广的上下文环境。当数据提供方将数据流入到数据基础设施,转移到外部实体时,常常伴随着一种信任焦虑,担心接收方是否能妥善处理这些数据,是否会非法截取、篡改或泄露数据等。
尽管有很多流通技术可选择,但是由于缺乏相应的技术要求标准,我们无法确定数据是否在合作方处到有效的保护,以及数据可以被哪些算法处理、使用次数和有效期是否能够得到有效界定并得到落实。这些都是数据使用权跨域管控的核心技术要求。
为确保数据在流通过程中,数据提供方依然能够对其进行有效控制,防止被窃取或者滥用等,应该制定数据使用权跨域管控技术要求标准,在标准中明确运维管控域的划分;明确流通参与各方需要遵从的原则、要求与义务;明确数据流通基础设施为支持实现数据跨域管控应该遵循的技术要求;明确事前、事中、事后全生命周期中数据跨域使用和应急处置的各种流程。由此,需要一整套围绕数据跨域流通过程中使用权的跨域保护为目标的技术要求标准,以明确保护责任、义务、技术手段、管理与运行流程等各类要素,为数据要素的流通提供制度性的安全保障。
三、数据可信流通技术的通用安全评估标准是数据大规模安全流通的“度量衡”
数据可信流通技术为数据流通各参与方提供高效便捷、安全可靠的数据计算分析能力,从而有效推动数据处理环节的高效率、低成本和高智能化。数据流通技术的安全性评估标准至关重要,通过对其进行安全性评估,可以增强行业信心,促进技术大规模部署,保护用户隐私和数据安全。
当前,数据可信流通技术呈现出多元化发展态势,包含隐私保护计算、使用控制、区块链等技术。隐私保护计算技术是一种基于密码学、分布式计算、人工智能、数据科学等领域的技术体系,在保护隐私信息的前提下,实现数据价值的分析和挖掘,即实现数据在加密的、非透明的状态下的计算,保护计算各参与方的隐私信息安全。数据使用控制技术基于预定义的控制策略并结合动态属性身份认证机制,保障数据消费者按照数据提供方设定的策略使用数据,维护数据提供方对数据使用的控制能力,相较于“可用不可见”的隐私保护计算,数据使用控制技术可实现“使用范围可界定”、数据“用后即焚”。区块链技术是一种块链式存储、不可篡改、安全可信的去中心化分布式账本,它结合了分布式存储、点对点传输、共识机制、密码学等技术,通过不断增长的数据块链记录交易和信息,确保数据的安全性和透明性。
由于不同技术路线的安全防护机制和侧重点各异,目前缺乏统一、全面的安全等级评价体系来客观比较多种数据可信流通技术的安全性能。虽然针对单一技术路线已经有一些评估规范类标准,但是不同技术路线的评估规范标准存在差异,用户无法对所有的产品进行横向比较。因此,制定数据可信流通技术通用评估规范类标准,针对不同安全等级的数据选择合适的数据可信流通技术,从而合理分配安全资源,在安全、性能和成本之间实现平衡。
综上所述,国家数据标准体系旨在建立技术信任革新趋势,简化数据“供得出、流得动、用得好、保安全”门槛,降低成本,扩大受益范围。数据标准体系跨越单一组织边界,实现跨主体、跨场景、跨行业的数据外循环标准体系,打造一个可信的交流生态系统。通过数据基础设施标准,实现数据合规高效地从源头顺利地接入、传输、开发到最终应用。通过制定和实施可控匿名化、数据使用权跨域管控的技术要求和数据可信流通技术的通用安全评估等系列标准,将为数据在多元主体、多样场景及广泛行业间的流畅、安全传递与循环利用提供有效支撑,让数据要素成为赋能数字经济和数字技术发展的强劲动力。
蚂蚁技术AntTech
科技是蚂蚁创造未来的核心动力
最新文章
蚂蚁科技奖专场|湖南大学佃仁伟:高分辨率高光谱智能融合成像
蚂蚁集团两项案例入选首期CCF产学合作基金优秀项目案例
蚂蚁集团牵头起草的《智能计算 图计算性能测试方法》国家标准正式获批立项
探索AI时代数据流通的新可能,2024“隐语”开源社区链接全球开发者超2万
论文秀Live#14 AAAI 2025|智能技术的跨界融合:图像处理与多任务学习的奇妙交汇
浙江大学与蚂蚁集团升级战略合作,共建“数据与智能联合研究中心”
CCF体系结构博士交流与学术辅导会议在蚂蚁集团召开
1/11 报名倒计时|「第二届隐语开源社区嘉年华」四大亮点抢先看,参会好礼送不停
攻坚安全可信技术,2024年蚂蚁集团16篇论文被顶会顶刊收录
《生成式大模型安全评估白皮书(2024)》正式发布(附下载链接)
蚂蚁集团2024科技生态白皮书 | 过去这一年,蚂蚁工程师平均每天发了一篇顶会论文
蚂蚁集团四个项目入选2024人工智能先锋案例
应对高复杂度业务系统下的网络安全防控问题,“切面融合智能蓝皮书”发布
OceanBase 再度入选 Gartner ® 云数据库管理系统报告“荣誉提及”
第五届中国人工智能大赛成果发布,蚂蚁多项成果入选
蚂蚁保入选2024“金信通”金融科技创新典型案例
三大模态全面落地!蚂蚁天鉴安全实验室通过信通院AIGC多模态检测服务系统评测
MEET 2025|蚂蚁开源负责人王旭:大模型是新的数据库
蚂蚁交互智能实验室最新开源Framer:用两张图片交互式生成轨迹可控的视频
蚂蚁密算、信通院等发起“密态计算产业链共建行动” 推动数据价值安全释放
开源之夏2024收官, TuGraph和铜锁项目参与学生斩获奖项
信通院发布首批大模型应用落地“样板间工程” 蚂蚁集团两项案例入选
蚂蚁集团20篇论文入选全球AI顶会NeurIPS2024
研讨会预告|NeurIPS 2024 蚂蚁 Workshop 邀您参加
论文秀Live#12 NeurIPS 2024|智能科技的深度探索:从知识代理到语言模型训练的成本优化
蚂蚁数科获2024年“金融密码杯”大赛一等奖
我厂程序员,认真起来,相当可爱
NeurIPS 2024论文解析:基于SPU实现的两方密态推理框架深度解读
蚂蚁科技奖专场|清华大学姚权铭:深度学习的简约之道
三大亮点,不容错过!Ray Forward 2024 议程详情抢先看!
有1700万人,想听图片开口说话
蚂蚁数科获NeurIPS 2024大模型隐私挑战赛赛道冠军
让大模型推理更安全可信,蚂蚁集团这项解决方案获奖
中国人工智能的2024:追赶ChatGPT不再是目标
通向赛博未来:EchoMimicV2半身数字人生成
从大数据到大模型:现代应用的数据范式
蚂蚁技术研究院最新开源:AI P图神器MagicQuill
论文秀Live#10直播预告|ISSTA 2024论文解读
支付宝参与的“基于云原生的大规模云边协同关键技术及应用”获2023年度浙江省科技进步一等奖
支付宝参与的“基于云原生的大规模云边协同关键技术及应用”获2023年度浙江省科技进步一等奖
蚂蚁集团旗下AI企业服务公司“数字蚂力”乌镇获奖:入选人工智能创新应用典型案例
致敬热爱技术的你!AFAC2024大赛获奖方案合集,请收藏~
乌镇峰会热议AI反诈:国内首个AI大模型攻防赛收官,全球十强亮相
蚂蚁集团AI技术、风控案例分别获得2024世界互联网大会重要奖项
蚂蚁保“灯塔风盾”获普惠金融产品创新奖,助力保险行业降本增效
世界互联网大会乌镇峰会智能体“桐小乌” 上线支小宝!
专家解读|构建国家数据标准体系,助力数据要素可信流通发展
蚂蚁技术研究院最新成果WarpDrive被计算机顶会HPCA 2025收录
AI能让小水滴跟着小姐姐一起跳舞吗?
即将收官!「全球AI大模型攻防挑战赛」将在乌镇公布全球十强
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉