解读《国家数据基础设施建设指引》(征求意见稿)| 五点思考

文摘   2024-11-24 16:22   上海  

寻合规之道,共筑数据保障之堡。专注为数据安全管理者、技术专家、隐私法务、律师等专业人士打造的知识共享与交流平台。

点击  "合规社"  > 点击右上角“···” > 设为星标⭐

作者 | Smart
图源 | pexels
责编 | 合规酱


探索数据安全要塞,守护数字世界。

——《数据守望》专栏
No.038

《国家数据基础设施建设指引》(征求意见稿)的五点思考

本文纲要
一、发布背景及正式发布
二、主要内容分析
三、重要技术术语及说明
四、通读后的五点启发

五、结语

 
数据要素成为新一轮的科技革命和产业革命的新机遇,数据流通利用和价值释放遇到了全新的挑战。国家层面也不断出台数据相关政策指导和建设指引。
数据要素当前处于起步阶段,属于前沿内容,虽然与很多企业和个人关联度较弱,但从宏观趋势上,个人有必要顺应趋势,对国家数据相关制度体系、政策等进行研读和学习,察觉数字经济的发展新动向,今天一起学习国家数据基础设施的内容。

为贯彻落实党的二十届三中全会关于“建设和运营国家数据基础设施,促进数据共享”的改革任务,国家数据局同国家发展改革委、工业和信息化部,立足当前发展实际,组织起草了《国家数据基础设施建设指引(征求意见稿)》(下简称《建设指引》),于2024年11月22日发布向社会征求意见。

图1:国家数据局发布征求意见稿
1.统一概念内涵

数据基础设施是从数据要素价值释放的角度出发,面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的新型基础设施。它集成了硬件、软件、模型算法、标准规范、机制设计等,是国家统筹下由区域、行业、企业等各类数据基础设施共同构成的有机整体。

2.明确发展远景

数据基础设施是数据基础制度和先进技术落地的重要载体,是数据要素流通的核心底座。《建设指引》中围绕“数据流通利用、数据算力底座、数据网络支撑、数据安全、数据应用”五方面明确了主要目标。

推进路径上,从时间维度划分为三阶段目标,如下表:

表1:《建设指引》推进路
3.数据基础设施的总体功能

国家数据基础设施的总体功能体现在“数据可信流通、高效算力供给、数据高速传输和全程安全可靠”四个方面,旨在打造高速互联、高效调度、可信流通、安全可靠的体系化能力,持续赋能各行业数据融合与智能化发展。

4.数据基础设施的总体架构

图2:国家数据基础设施总体架构图
数据基础设施总体架构划分三层,分别是设施层、功能层和应用层 设施层 」包括数据流通利用设施、算力底座和网络支撑。其中数据流通利用设施是重要组成部分,并涉及“数据空间”“数联网”“数场”“区块链”“隐私保护计算”等关键技术设施,属于数据领域的新鲜概念。

 功能层 」主要围绕数据采集、汇聚、传输、加工、流通、利用、运营、安全八大能力进行定义。
应用层则是强调数据的融合应用,赋能各行各业各领域,促进数据多场景应用、跨主题复用,为各类数据应用场景创造条件。

5.数据基础设施的主要构成

国家数据基础设施从类型上看,包括“国家基础设施、行业基础设施、区域基础设施、企业基础设施”,其中以行业、区域数据基础设施为主体,以企业数据基础设施为重要组成。涉及的主要平台或系统进行整理,如下表:

表2:数据基础设施相关的重要平台

 6.数据基础设施的重点方向

《建设指引》提出了国家数据基础设施的五个重点方向,包括“一个底座”和”四个体系”,分别是数据流通利用设施底座,数据高效供给体系、数据可信流通体系、数据便捷交付体系、数据应用体系。主要内容如下:

表3:数据流通利用设施底座主要功能

  • 数据高效供给体系

依赖于丰富多样的数据源,提出“公共数据、企业数据、个人数据及各类高质量数据集”的说法,对社会形成统一的数据资源目录开发,提出高质量数据标准与交付规则,目的是提高数据质量。

  • 数据可信流通体系

提出了企业可信数据空间、行业可信数据空间、城市可信数据空间、个人可信数据空间和跨境可信数据空间等概念。鼓励采用区块链、隐私保护计算技术,建设数联网、数据元件、数据流通交易公共数据服务平台等技术保障数据可信流通。

  • 数据便捷交付体系

提出构建数据交付基础设施,区分场内集中交易和场外分散交易机制,重点推进各类交易所、交易平台的互联互通,在数据价值贡献度评估、数据集推荐匹配、数据产品差异性分析等方面加强创新研究。

  • 行业数据应用体系

强调以数据场景为牵引,重点建设重点行业的数据应用基础设施,促进行业数据应用创新。培育基于数据要素的新产品和新服务,促进数据多场景应用、跨主体复用,实现知识扩散、价值倍增。

7.算力底座的要求

-推进算力资源的科学布局。包括通用算力、智能算力和超级算力等多元异构算力的发展。
-推进东中西部算力协同,促进东部高时延业务向西部转移。
-推动算力资源跨平台、跨层级、跨区域的混合部署和算力的统一调度。
-推进算力与数据、算法融合创新,推进与绿色电力的融合,推动算力发展与安全保障协同,对算力资源构建全生命周期的安全管控措施。
8.网络支撑的要求

建设高速数据传输网,支持基础电信运营商叠加虚拟化组网、网络协议创新和智能化任务调度等云网融合技术,形成多方快速组网和数据交换能力,支持面向数据传输任务的弹性带宽和多量纲计费。
9.安全防护要求
关于“国家数据基础设施”的安全保障体系,主要围绕两个层面开展:

  • 国家数据基础设施的安全保障

主要目标是实现可信接入、安全互联、跨域管控和全栈防护,对网络安全风险和威胁的动态发现和处置,加强外部威胁的监测与应急响应。

  • 数据流通利用的安全保障

主要利用隐私保护计算、区块链、数据使用控制等新型技术手段,围绕数据可信采集、加密传输、可靠传输、受控交换共享、销毁确认和存证溯源等方面加强安全管控,保障高价值、高敏感数据“可用不可见”“可控可计量”“可溯可审计”,贯穿数据全生命周期的各环节安全。

《建设指引》对重要技术术语进行说明,主要涉及三方面,如下:

1.数据流通利用技术

在数据流通利用领域,目前常用的技术路线主要包括隐私保护计算、区块链、数据使用控制等。

  • 隐私保护计算

隐私保护计算指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一类信息技术,保障数据在产生、存储、计算、应用、销毁等数据流转全过程的各个环节中“可用不可见”。隐私保护计算的常用技术方案有安全多方计算、联邦学习、可信执行环境、密态计算等;常用的底层技术有混淆电路、不经意传输、秘密分享、同态加密等。

  • 区块链

区块链是分布式网络、加密技术、智能合约等多种技术集成的新型数据库软件,具有多中心化、共识可信、不可篡改、可追溯等特性,主要用于解决数据流通过程中的信任和安全问题。

  • 数据使用控制

数据使用控制是指在数据的传输、存储、使用和销毁环节采用技术手段进行控制,如通过智能合约技术,将数据权益主体的数据使用控制意愿转化为可机读处理的智能合约条款,解决数据可控的前置性问题,实现对数据资产使用的时间、地点、主体、行为和客体等因素的控制。

2.数据流通利用实践方案

在数据流通利用领域,目前业界的实践方案主要包括可信数据空间、数场、数联网、数据元件等。

  • 可信数据空间

可信数据空间是指数据资源开放互联、可信流通的一类数据流通利用设施,其以数据使用控制为核心,以连接器为技术载体,以实现数据可信交付,保障数据流通中“可用不可见”“可控可计量”为目标,具备数据可信管控、资源交互、价值创造三大核心能力。

图3:可信数据空间架构图
  • 数场

数场是依托开放性网络及算力和隐私保护计算、区块链等各类关联功能设施,面向数据要素提供线上线下资源登记、供需匹配、交易流通、开发利用、存证溯源等功能,支持多场景应用的一种综合性数据流通利用设施。

数场从点、线、面、场、安全五个维度构建标准化技术框架。数场在技术架构上包括接入点、功能平台、管理平台、安全保障、网络传输等基础服务平台。

  」是数据主体进入数场的接入点。线是数场内连接各主体、各平台的数据高速传输网,实现数场内各主体之间的互联互通。
  」是数场中数据主体、传输网络的集合,是实现数据大规模流通、高效安全利用的核心。
由点到线、由线到面构成数场基础设施。
  」是基于数场基础设施构建的数据应用、场景化创新,以及相关能力、流程、规范的统称。
 安全 」是覆盖点、线、面、场的动态全流程保护措施。
图4:数场功能架构图
  • 数联网

数联网由数据流通接入终端、数据流通网络、数据流通服务平台构成,提供一点接入、广泛连接、标准交付、安全可信、合规监管、开放兼容的数据流通服务。
图5:数联网功能架构图
  • 数据元件

数据元件提供统一标准、自主可控、安全可靠、全程监管的数据存储和加工服务,支持采用标准化工序完成数据产品规模化加工、生产和再利用,适用于大规模数据加工和生产场景。数据元件作为连接数据供需两端的“中间态”,将原始数据与数据应用“解耦”,基于数据元件相关组件,实现从数据归集到数据元件加工交易全生命周期的数据要素开发和管控。

3.数据安全技术

数据安全技术为数据收集、存储、处理、传输、共享和销毁等全生命周期提供安全保障,包括数据备份与恢复、应用数据加密、数据泄露检测、流转监测、身份认证与访问控制、数据脱敏、数据水印、数据安全态势感知等8项技术。

个人对《建设指引》进行深入学习和扩展阅读,对其中遇到问题及补充知识进行整理,如下:

1.区分数字和数据的区别

从数字和数据的各个名词看它们的区别,比如数字经济、数字中国、数字社会,数据要素、数据流通、数据设施、数据算力、数据产品等等,可以看出“数字”概念更大,偏宏观;数据更具体,颗粒度更细,偏业务和技术

数字化的过程之一是把社会、生活中的物理世界三维空间的运行状态转化成数字后,可计量可观测。数字跟单位(量词)结合在一起,具备显性的业务价值。比如时速120km/小时,100元,50斤。把数据增加单位后让人更容易理解。数据更像是技术处理的元素,像0/1的比特流,需要通过开发利用、数据流通产生价值,才能赋能数字经济。

2.重点行业的数据融合应用

今年9月25日发布的《国家数据标准体系建设指南》中,提出工业制造、农业农村、商贸流通、交通运输、金融服务、科技创新、文化旅游、卫生健康、应急管理、气象服务、城市治理、绿色低碳提出12个重点行业数据融合应用。此外,国家数据局等部门关于印发《“数据要素×”三年行动计划(2024—2026年)》的通知中也提到12个重点行业,与上述一致,如下图:

图6:《国家数据标准体系建设指南》标准体系框架

而《建设指引》提及的工业制造、现代农业、数字金融、智慧交通、跨境物流、航运贸易、智慧医疗、数字文化、绿色低碳,略微有差异,个人建议尽量保持一致

3.数据处理活动进一步扩展

《数据安全法》提出的数据处理活动包括“收集、存储、使用、加工、传输、提供、公开等”,个人认为更多指数据技术层面的处理活动
《建设指引》中提出“数据采集、汇聚、传输、加工、流通、利用、运营、安全服务”等核心功能,增加了“数据流通、数据利用、数据运营”等概念加入其中,除了数据技术活动,它外延到数据业务层面活动,比如数据流通包含数据确权、数据产品、数据资源定价、数据流通交易等环节

此外,数据运营方面,在过去的几年我们更多聚焦大数据平台中的数据加工使用、数据质量处理。《建设指引》中的数据目录管理、数据共享管理、数据服务、数据合作,包括数据资源定价、确权等都可以纳入数据“大运营”的范畴,得到了进一步的扩展。

4.数据安全覆盖范围扩大

以前的数据安全只考虑数据安全管理、数据安全技术,现在的数据安全不仅是一项安全工作,和数据、业务、合规等融合在一起。当前国家网信重点推进数据安全风险评估工作,把数据处理活动、个人信息保护纳入其中,强调数据安全需要覆盖到数据处理活动和个人信息。

除此之外,国家最近发布各类数据相关政策,对数据安全覆盖的范围进一步扩大,例如增加了数据基础设施安全、数据要素流通市场安全、数据流通安全的内容。从《建设指引》中,我们看到在数据流通利用中,国家从顶层进行设计,在数据业务流通过程中,从业务规则、业务流程等层面增加安全元素(内生安全),避免靠外挂式的安全产品成为主要控制手段,过多阻碍数据的流通。

这与业务应用软件通过功能设计、业务逻辑控制,增加安全内生功能的思路一致。例如,现在很多业务级网关逐渐把API安全网关的功能进行覆盖,比如API资产管理、限流、黑名单、业务鉴权、调用审计等功能,作为业务功能的一部分统一考虑安全。

如果按这个逻辑演进,数据安全可能最后又会回到“纯安全领域”,数据业务部分的安全通过顶层设计和软件系统内生安全进行管控。

数据安全的重心更多地做好数据业务、数据流通过程中的风险监测,而非“安全防护”,从监测视角及时发现数据全过程的风险。

5.国家层面的数据基础设施

《建设指引》提出“跨层级、跨地域、跨部门、跨业务”等概念,其中跨层级包含政府、行业企业等主体,国家、省、市、县等层级。跨地域比较好理解,以行政区域划分,物理区域相近的再逐步融合与数据打通,避免数据仅仅在区域内流通,比如长三角地带(江苏、浙江、上海、安徽)数据融通,这可以解决数据产品、数据模型开发能力强的省份,可以跨省区域进行数据融合探索。

过去我们做数据开发,更多是围绕大数据平台开展,平台内使用“数据沙箱”保障数据不落地,而国家层面考虑不同层级的可信空间,如城市可信空间、企业可信空间、个人可信空间、行业可信空间等,考虑这些可信空间的互联互通、统一标准体系等。

所以在数据流通利用方面,提出了可信数据空间、数场、数联网、数据元件等概念因为数据要素价值流通本身就是一项新鲜事物,需要先从上到下规划设计,更需要从下往上的试点试验、先行先试方式,总结提炼最佳实践,再普及推广的思路。

虽然一直从事数据安全工作,但最近两年一直在持续补充学习数据、合规、业务、运营等方面知识,跟进数据相关的政策,并不是为了超越这些行业的专业人才,更多是扩展补充知识。
了解他们做的事情,更好地从甲方视角、业务维度,考虑数据安全这件事情该怎么做,紧贴数据业务的动态变化来不断适应。
注:本文涉及部分文字、图片等来自于国家公开资料或征求意见稿,文中观点仅代表个人看法,仅供参考

-END-

👆点击图片了解详情

加入社区、商务合作、

投稿等,加二维码咨询 



合规社
数据安全与隐私保护新知分享平台
 最新文章