[法规规划]梅宏院士解读《国家数据基础设施建设指引》

文摘   2025-01-09 12:45   北京  

 既然是基础设施,那就想想通信基础设施是如何管理的。



梅宏院士是北大信息技术学院教授,同时也是最近刚成立的国家数据专家咨询委员会副主任。


在一众专家中,个人觉得梅院士比起其他一些专家,离商业化远一点,观点相对而言能直击问题,也能揭示一些深层问题,值得看一下。




01   互联网是数字经济时代基础设施的关键核心

————————




基础设施是指为国家、城市或地区提供的支持其经济和社会运行的物质工程设施和公共服务,是社会赖以生存发展的一般物质条件。无论哪一种经济形态,其健康有序发展,均需要良好的基础设施作为保障支撑。


在数字经济时代,互联网是其基础设施的关键核心。实际上,数字经济概念就源自互联网在上世纪90年代中期开始的大规模商用。1996年,美国学者唐·泰普斯科特在《数字经济:网络智能时代的前景与风险》中正式提出“数字经济”一词,描述和预测了互联网将改变各类事务运行模式。由于当时的信息技术对经济的影响尚未具备颠覆性,所以数字经济一词主要用于描述互联网对商业行为造成的影响,特指以电子商务和电子交易为代表的经济活动。


随着互联网从信息空间向人类社会和物理世界的延伸,以及云计算、大数据、人工智能、移动互联网、物联网等新一代信息技术的快速发展,数字经济的内涵发生了深刻变化。在我国,数字经济通俗地分为数字产业化和产业数字化两大部分:数字产业化主要指信息技术产业,包括电子信息制造业、软件和信息服务业、信息通信业等;产业数字化则指借助新一代信息技术对传统产业及其产业链上下游进行全要素数字化改造,实现赋值、赋能。在这一过程中,互联网作为数字经济时代基础设施的关键核心,其作用主要体现在两个方面:


一方面,互联网、移动互联网、物联网等网络设施,以及基于网络的WWW、数据中心、云计算平台等公共服务,构成了数字经济时代的信息基础设施。这些设施为数据的传输、存储和处理提供了基础平台,使得信息能够在全球范围内快速流动,为数字经济的发展提供了必要的技术条件。


另一方面,传统物理基础设施也在互联网的推动下加速数字化转型,形成了工业互联网、智慧交通、智能电网等新型基础设施。这些新型基础设施将物理世界与数字世界深度融合,提高了资源配置效率,优化了经济运行模式,成为数字经济发展的重要支撑。


当前,人机物(人类社会、信息空间与物理世界)融合泛在计算的新时代正在开启,信息技术不再仅仅是作为既有业务流程中提质增效的助手和工具,而是将成为引领产业组织重构、流程再造、升级发展的核心引擎,其根源在于信息技术特别是互联网的快速发展和广泛深度应用所产生的大数据为人类提供了认识复杂系统、探知客观规律,进而改造客观世界的新思维和新手段。


《建设指引》指出“数字经济时代,网络设施、算力设施、应用设施等构建了数字基础设施。当前,数据成为关键生产要素,催生新的技术—经济范式,重塑产业发展方式,推动数字基础设施向数据基础设施延伸和拓展”,对基于网络设施、算力设施等现有互联网设施建设国家数据基础设施给出了一体化统筹布局。




02   数据基础设施是互联网技术体系的拓展和延伸

——————————————————



在数字经济时代,数据已成为基础性、战略性资源,成为关键生产要素,赋能赋值生产、分配、交换和消费的各个环节,并支撑劳动力、资本、土地、技术、管理等生产要素的网络化共享、集约化整合、协作化开发和高效化利用。数据的高效共享、流通、交易是数字经济的源头活水,培育数据要素市场成为数字经济发展的基本前提;数字治理体系是数据要素市场健康有序及数字经济健康发展的根本保障,以最大限度释放数据价值为目标的数据治理则是数字治理的资源基础。


然而,互联网在支撑数据要素市场和数据治理体系建设方面的能力和效率还远远不够,数据共享流通成本高,制约了数据价值的释放和数字经济的发展。产生这一问题的根本原因在于互联网的设计初衷是使能计算机之间协同工作以共同支撑应用的运行,传统的计算机应用都是按业务需求设计信息系统、按系统功能组织数据,数据紧密耦合在应用之中,互联网仅是提供了应用内部运行在不同计算机上的计算任务之间的数据传输通道。因此,在现有互联网技术体系下,数据全生命周期均由互联网上的信息应用系统所控制,数据并非是互联网上可直接管理的独立资源,基于互联网的数据流通共享需要在应用之间进行协同,流通共享成本高。


为此,需要构建一套“以数据为中心”的新的基础设施层,可称之为“数据基础设施”,主要包含两个层面:


一是将数据与应用解耦,使得数据可以作为互联网上可独立管理的资源被标识、定位、发现和访问,从而在“物理/机器”互联网之上形成一个“虚拟/数据”网络“数联网”,实现全网一体化的数据互联互通互操作。


二是面向具体的领域和业务场景,按照数据所对应的物理实体的结构、关系来对数据进行管理和组织,使数据实体、数据活动(包括数据的传输、存储和处理运算等)及其相互之间的关系构成一个物理世界的“数字孪生”,可称之为“数据空间”。数据空间可视为围绕现实世界的个人或机构所构建的“全量”数据集,数据应用运行在特定数据空间内,以满足各类场景化需求。


《建设指引》提出“国家数据基础设施是从数据要素价值释放的角度出发,面向社会提供数据采集、汇聚、传输、加工、流通、利用、运营、安全服务的一类新型基础设施”,并给出了总体架构图,进一步从功能视角明晰了数据基础设施的结构组成。


这里大家一定要注意基础设施这四个字,这也就决定了相关的设施,以及基于这些设施构建的诸如可信数据空间等等的管理方式,以及各类企业可以参与的程度。




03   创新应用引领数据基础设施建设与发展

——————————————————


考察国际数据基础设施的发展历程,大多是从明确的应用需求出发牵引技术研究和系统建设。例如,图灵奖得主、TCP/IP协议发明人罗伯特·卡恩提出的互联网数据资源互操作架构——数字对象架构DOA就起源于其主持的数字图书馆项目。该项目由美国DARPA资助,主要目标是为美国大学的计算机院系搭建数字图书馆系统,将已有的图书、文档、技术报告等文献资料电子化并接入互联网,以实现数字图书馆系统间的互联互通。后来,卡恩将数字图书馆泛化为信息系统,将文献资料泛化为任意数据资源,提出了数字对象架构DOA,并在瑞士日内瓦成立了DONA基金会对DOA进行推广应用。DONA运营了覆盖全球的Handle系统,全球数字出版系统DOI即是其一个重要的应用案例。


又如,德国弗劳恩霍夫协会在2014年提出工业数据空间(Industrial Data Space,IDS),目的在于解决工业领域数据保护与共享之间存在的冲突。后来推广至跨行业和跨地理边界的企业,改名为国际数据空间(International Data Spaces,IDS),并成立了IDSA组织,致力于制定全球数据权属和可信共享的标准。随着欧盟在2020年发布《欧洲数据战略》,提出构建战略部门和公共利益领域的统一数据空间,IDS作为参考架构得到快速推广应用。


《建设指引》指出“当前,我国数据基础设施处于起步建设阶段,围绕流通利用业务场景,各地方各行业各领域探索形成多种有针对性的技术方案和解决路径,并在不断迭代发展”,并且在推进路径中明确提出“2024—2026年,利用2—3年左右时间,围绕重要行业领域和典型应用场景,开展数据基础设施技术路线试点试验,支持部分地方、行业、领域先行先试,丰富解决方案供给”。在顶层框架设计之下,留足了实践探索空间,且凸显了创新应用引领。


国家数据基础设施的建设,开启了推动我国数字经济高质量发展的新阶段,也将对全球数字经济发展起到示范引领作用。



04   欧洲工业数据空间

——————————————————


上边最后一段提到了欧洲的工业数据空间项目,我们这里也就顺道简单介绍一下。


这个工业数据空间项目是出自《欧洲数据战略》的,最早是德国于2014年张罗提出来的。我们的可信数据空间的一些设计应该也是借鉴了欧洲这个数据空间的设计思路的。



图源:互联网


根据IDS(国际数据空间协会)定义,数据空间是一个虚拟空间,它基于通用协议和格式以及安全可信的数据共享机制,为数据交换提供了一个标准化框架。

《欧洲数据战略》中提到,为实现欧洲单一数据市场,需建设欧盟数据空间,即一种能保障企业数据、公共数据、个人数据有序流通应用的技术体系。其核心价值是赋予了数据提供方一种新型的权利——数据主权,即数据所有者保留对其数据的控制权,可以确定谁可以使用数据以及在什么条件下使用数据。


经过近10年的发展,数据空间理念已经从德国构想走向欧洲共识,从产学研侧探索发展至欧盟范围战略立法支持,成为欧洲数据战略中数字基础设施的重要组成。


目前已构建134个数据空间。




建设路径两大类

政府主导和行业发起




这里我们不介绍那么详细了,大家感兴趣也可以自己搜索来看。


我们对可信数据空间的一些解读材料,大家感兴趣可以后台回复 0109  下载。



***   历史文章分类推荐

——————————————————


数据概念




法规规划


方案实操


公共数据


清华数据大讲堂系列






数据资产化,鼹鼠哥与你一起。



欢迎大家公众号后台留言,或者后台回复“进群”,进群一起聊。



IT鼹鼠
CDMP/AWS认证架构师/高级项目管理师/ACS/香港金融优才,希望把20+年企业IT和云与大数据行业,从头部大厂到创业公司的所得和您分享。
 最新文章