驾驭数据洪流,筑牢可信之基:打造未来可信数据空间

文摘   科技   2024-08-16 12:53   北京  

编者荐语:



在数据为王的时代,信息数据是推动社会脉动的强大力量,同时也带来了信任缺失与安全威胁双重挑战在这场数据革命浪潮中,“可信数据空间”应时而出,作为数据流通领域的未来基础设施,其筑起了数据安全流通的坚固桥梁期望本文能为关注数据领域从业者学者提供一定参考


驾驭数据洪流,筑牢可信之基:打造未来可信数据空间
亚信科技(中国)有限公司
摘要作为数据流通新时代的基础设施,数据空间保障数据流通的可信、可控、可证,成功破解了数据市场面临的信任与安全难题,展现出广泛的应用潜力。亚信科技在数据空间的基础上,深入探索数据使用控制、数字身份认证、数据合约数字化等关键技术,遵循“五可”原则,精心设计了集中式的可信数据空间解决方案,为各行各业的数字化转型注入了新的活力与可能。

数据空间概述

早在2016年,德国弗劳恩霍夫协会前瞻性的提出了“数据空间”这一创新概念。随后,在国际数据空间联盟(IDSA)的不懈推动与拓展之下,这一理念逐步从专注工业领域的“工业数据空间”跃升为更加宽广的“国际数据空间”(IDS),跨越国界,连接全球。在此基础上,中国信息通信研究院两化所与工业互联网产业联盟携手合作,中国信息通信研究院在此基础上,结合本土实践,提出了“可信数据空间”(TDM)的概念。TDM不仅继承了IDS的核心理念,即在数据主权原则下构建安全、受保护的数据流通环境,还进一步强化了数据流通的安全性、透明度和效率。TDM通过体系化的技术安排,如数据使用控制、数字身份认证、数据合约数字化等,确保数据流通协议的确认、履行和维护,解决了数据要素提供方、使用方、服务方、监管方等主体间的安全与信任问题。


表1:数据空间概念定义


(一)国际数据空间(IDS)核心观点


图1:国际数据空间的角色应用


如图所示,IDS参与角色包含:


• 核心参与者包含数据供需方;

• 中间机构包含身份认证机构、数据中介、应用商店、词汇中介、票据交换所等;

• 软件开发者包含应用开发者和连接器开发者;

• 空间治理机构包含认证机构和评估设施以及标准化组织。


图2:国际数据空间的核心组件


如图所示,IDS核心组件包含:


• 连接器(Connector)是数据空间中联通数据与服务的网关,也为各应用程序(App)和软件提供可信任的运行环境。

• 身份提供组件(Identity Provider)创建、维护和管理一个数据空间内参与者的身份信息及其有效期。

• 合约磋商组件(Contract Negotiation)提供包含创建和协商在内的合约管理服务。

• 策略引擎组件(Policy Engine)负责按数据合约条款执行数据使用策略。

• 策略监测组件(Monitoring)负责跟踪并反馈策略执行情况。


(二)可信数据空间(TDM)核心观点

图3可信数据空间的应用架构


如图所示,可信数据空间主要包含以下观点:


• 利益相关方:数据提供方、数据使用方、第三方服务提供方和监管方。

• 数据类型:公共数据、企业数据、个人数据和其他数据

• 流通模式:包含集中式和联邦式。


综上,可信数据空间(TDM)是对国际数据空间(IDS)概念的演进,从流程、技术、功能和业务视角进一步丰富了数据空间的内涵。本文围绕可信数据空间展开讨论。

可信数据空间的特点

可信数据空间能够有效解决数据流通中的安全与信任问题,其具备以下特点:


1. 可信


• 参与方身份可信:对参与数据流通各类组织、用户、软件、APP、平台等进行身份认证,降低参与主体间的信任沟通成本。

• 流通对象可信:数据来源合法、质量可靠、流通方式合规。

• 流通环境可信:流通环节安全,数据在流通过程中不会被篡改。


2. 可控


• 合约捍卫数据主权:依托区块链等先进技术,将数据使用权、访问范围及期限等核心要素编码入智能合约,为数据资产穿上“智能锁”。

• 精细化数据权限管控:数据供需方通过智能合约明确界定数据使用的具体条款与条件,实现权限设定的自动化与执行的智能化。


3. 可证


• 日志记录透明可证:操作日志记录关键处理节点,并通过区块链存证加固日志的不可篡改性,为数据交互的历史留存不可磨灭的数字指纹。

• 日志开放追溯无忧:日志便捷查询帮助供需双方自证明晰,保障任意方数据权益不受侵犯。


可信数据空间的应用场景

如下表所示,数据流通领域根据流通模式可分为L0~L3四个级别,传统的数据空间聚焦于L1明文可控的流通模式,近期可信数据空间开始向L2密态计算模式延伸。


表2:数据流通管控


本文围绕基于数据使用控制等技术的L1模式开展研究,提供明文可见、精细管控的跨域流通服务。


(一)制造


制造业数据可信流通主要涵盖产品数字化、生产管控、供应链优化和设备全生命周期管理,贯穿设计、生产、物流、销售、服务整个产品全生命周期中多业务环节。基于去中心化、可信、可控、可追溯的新型数据空间模式,实现制造业数据共享交换。


图4制造业的数据空间场景


• 智能制造:利用可信数据空间技术,实现设备和设备之间的数据共享和协同,提高生产效率和降低生产成本。比如通过数据空间实现设备之间的实时数据采集和共享,实现智能制造。


• 质量控制与预测维护:利用可信数据空间技术收集和分析设备和产品的数据,检测生产过程中的异常情况,提前预测设备的维护需求,从而降低故障率,提高产品质量。


• 供应链协同:制造业的供应链中涉及众多合作伙伴和环节,通过可信数据空间技术实现供应链信息的共享与协同,可以提高供应链的透明度和响应速度,降低库存与成本。


• 产品追溯与溯源:利用可信数据空间技术,追溯产品从原材料到成品的整个生产过程,检测产品的生产历史和来源,实现产品的全程追溯和溯源。

可信数据空间在制造业领域的应用可以帮助企业实现智能制造、提高生产效率、优化产品质量、降低成本以及实现供应链协同等目标。通过数据空间技术的应用,制造业可以实现数字化转型,提升竞争力。


(二)金融


金融数据可信流通基于整体数据流通策略、数据使用策略,分层进行精细化控制。银行等金融机构,在营销、风控等业务活动中大量依赖内外部数据要素支持,是数据要素市场的主要参与者,因为基于数据空间的可信流通可应用到以下场景中:


图5金融行业的数据空间场景


• 风险管理与监控:利用可信数据空间技术整合各类数据源,包括客户数据、市场数据、交易数据等,进行风险分析和监控。通过数据空间平台实现对金融风险的实时监测和预警,提高风险管理效率。


• 反欺诈与安全:利用可信数据空间技术整合海量数据,实现欺诈行为的识别和预防。通过分析数据空间中的交易记录、行为模式等数据,帮助金融机构识别潜在的欺诈风险。


• 资产管理与投资决策:利用可信数据空间技术整合市场数据、企业财务数据等各类数据源,为资产管理和投资决策提供数据支持。通过数据空间技术实现对市场趋势和投资风险的分析,帮助投资者做出更加准确的决策。


• 合规与监管:金融机构需要遵守严格的法规和监管要求,可信数据空间技术可以帮助金融机构整合各类监管数据,实现对金融交易和操作的全面监控,确保合规性。


通过数据空间技术的应用,金融机构可以提高风险管理能力、优化业务流程、提升客户体验,同时满足监管要求,促进金融业务的创新和发展。


(三)政务


在政务行业,特别是在公共数据授权运营场景下,可信数据空间作为一种集成的数据管理和交换平台,为政府机构提供了安全、合规的数据存储、处理与共享环境,应用于城市治理、公共服务、产业赋能等多个维度,可有效促进了政务数据价值的挖掘与释放,加速了数字化政府转型和服务型政府建设。


图6:政务行业的数据空间场景

• 数据共享与互联:政府部门拥有大量的公共数据资源,通过可信数据空间技术建立数据共享机制,实现不同部门之间数据的互联互通。不同部门之间可以共享数据、资源和信息,提高政府机构之间的协同工作效率。


• 政务决策支持:政府可以利用数据空间技术整合各类公共数据,进行数据分析和挖掘,为政府决策提供支持。政府部门可以通过可信数据空间平台获取多维度的数据信息,更好地了解社会经济状况和民生情况,做出更科学的政务决策。


• 智慧城市建设:可信数据空间技术可以帮助政府建设智慧城市,实现城市各类数据的整合和共享。通过数据空间平台实现城市基础设施的监控、数据分析、城市规划等,提高城市管理的智能化水平。


• 服务优化与个性化:利用可信数据空间技术整合公共服务数据,为市民提供更优质、更个性化的公共服务。政府可以通过数据分析和挖掘,了解市民需求并制定个性化的政策和服务方案,提升市民满意度。


通过可信数据空间技术在政务行业的应用,政府可以提升政务效率、加强数据治理能力、提升公共服务水平,促进政府治理的现代化和智能化发展。同时,可信数据空间也可以促进政府与市民、企业之间的更加紧密互动和合作,实现共赢局面。


可信数据空间的关键技术


(一)数字身份认证


可信数据空间系统采用分布式身份管理方案,并允许用户定制信任锚(信任锚是验证身份和建立信任关系的基础软件设施),提高身份管理的灵活性和安全性,允许用户根据自己的需求和安全策略定制信任锚。可信数据空间的身份认证主要包括以下步骤:


• 身份认证(Authentication)身份认证是验证用户、设备或系统身份的过程,确保他们是他们声称的那个人或实体。通常使用用户名和密码、数字证书、生物识别技术(如指纹或面部识别)等方法进行认证。在数据空间中,身份认证确保只有经过验证的用户才能访问或操作数据。


• 授权(Authorization):授权是在身份认证之后的一个步骤,它决定了经过认证的用户可以访问哪些资源以及可以执行哪些操作。授权过程通常基于角色的权限控制(RBAC)、属性基的访问控制(ABAC)或更细粒度的策略定义。授权确保用户只能访问他们被允许的数据和执行他们被授权的操作。


• 访问控制(Access Control):访问控制结合了身份认证和授权,通过定义明确的规则来控制对数据和资源的访问。访问控制可以是静态的,也可以是动态的,根据用户的行为、环境条件或数据的敏感性来调整访问权限。


(二)数据合约数字化


传统的数据交换合约是基于法律框架下签署保密协议或客户授权书,以非结构化文本的方式作为数据流通的凭证附件进行管理。数据合约数字化技术是在数据交换平台上将传统的纸面化合约通过安全软件实现在线签署和传输,签署完成后由数据交换平台各组件根据合约签订条件执行。


(三)数据使用控制


数据使用控制技术是数据空间中最核心的技术,是对传统访问控制机制的扩展,支持复杂的策略控制要求,是实施数据流通后数据权益保护的关键机制。传统的访问控制的规则粒度较粗,一般到明确的对象粒度,决策结果通常也只有允许和拒绝。使用控制策略匹配的规则颗粒度细化到对象的属性,而且决策的结果是多分支的,可以结合数据权益保护的要求实现多种策略结果。例如可以控制数据使用方在指定的时间范围、地域才能访问数据,并发送数据的使用结果到数据权益方。


图7:数据使用控制方式


数据使用控制模型定义了常用的“4W2H”6类数据管控维度,包括Who、When、Where、Do What、How to、How many,在每个维度上可以进行更细粒度的数据使用管控和控制策略组合,例如阅后即焚、定时访问、定点访问、定量访问等。


图8数据使用控制策略


常见的使用控制能力如下表所示。


表3:数据空间的数据使用控制能力


(四)据存证溯源


 数据存证与溯源机制致力于在数据从产生到消亡的整个流转期间,实施全面的日志记录、跟踪数据的使用与处理轨迹。这一过程涵盖了从数据资源发布、数据合约签订、使用策略判断,数据传输与接收、数据处理,直至数据销毁等每一个关键环节。通过精细化的日志文档,该机制能够构建起一条完整可追溯的数据链路,并依托这些详实的日志信息,提供高效、精准的链路分析与溯源服务,确保数据生命周期的透明度与可验证性得以极大提升。

可信数据空间的实现方案
 可信数据空间是在一定范围内联通各数据参与方、提供可信流通服务的基础设施,并在该设施基础上构建数据流通生态。打造集中式的可信数据空间解决方案,赋能政府委办和垂直行业可信数据流通。


(一)方案框架


亚信科技数据空间基础设施由流通服务平台和数联终端组成,分别在运营侧和数据供需侧部署。


图9数据空间的方案框架


流通服务平台不仅作为数据空间的流通枢纽,承担着数据交换和流通的核心功能,还通过其多层次结构,为整个数据空间提供支撑和管理。流通服务平台包含了四个层次:

• 基础设施层提供必要的计算、存储、网络和区块链资源;
• 资源接入层负责节点接入与认证、数据标准化、元数据发布、数据标识管理以及算网资源调度;
• 流通管控层则集成了空间管理、控制策略管理、流通模式与交付管理以及安全管理功能;
• 流通服务层提供数据流通所需的支撑和增值服务。

数联终端作为数据空间的端侧桥梁,承担数据交换和计算职责,覆盖了各种流通模式下的数据交付能力。其功能同样分为四个层次:

• 基础设施层的功能同上述流通服务平台;
• 资源准备层负责连接器和数据资源的预备工作;

• 管控执行层根据预设的策略和规则,实现细粒度的访问控制;
• 数据交换层则包含数据加工、数据交付以及日志同步功能。


(二)方案特点


可信数据空间解决方案紧密围绕“五可”原则设计,旨在构建一个高度灵活、安全可控且高效利用的数据管理与流通生态系统,具有以下特点:


• 可发现——全面覆盖的资源管理与发现机制


    依托智能化的数据标识管理和主动元数据能力,不仅实现了数据源的广泛接入和识别,还能够自动编目,支持基于自然语言的搜索功能,确保用户能快速定位到所需数据,提升数据的可发现性。


• 可访问——灵活安全的访问控制策略


    采用多层次安全策略与访问控制技术,确保不同角色的用户仅能访问其权限内的数据资源,同时通过API网关等技术,提供了便捷且安全的数据访问途径,平衡了数据共享与安全的双重需求。


• 可管控——细粒度的策略执行与监管能力


    通过高度定制化的策略引擎实现对数据流通开展精细化的控制,包括动态调整数据访问权限、实施数据操作的监控与审计以及基于策略的自动化合规检查,全面强化了数据使用的合规性和安全性。


• 可共享——多模式支持的数据共享平台


    广泛支持从内部数据协同到跨组织数据交换的多样化的共享模式,促进数据在不同场景下的有效流通与协作,增强了组织内外部的协同效率。


• 可流通——高效安全的数据流通机制


    高效的数据传输协议和加密技术,确保数据在不同系统、组织间快速、安全地流通。无论是实时数据流处理,还是大规模数据迁移,都能提供稳定可靠的传输服务,同时结合数据脱敏、隐私计算等技术,保障了数据流通过程中的隐私与安全。


(三)适用场景


可信数据空间解决方案为构建高效的数据流通生态提供了新途径。它支持创建两种主要的数据共享环境:企业空间和开放空间,各自服务于不同的需求和目标。


企业空间是为单一企业或政府机构量身定制的封闭环境,允许组织内部部门安全地共享和交换数据。它旨在加强内部协同,提升决策效率,加速产品迭代,并优化流程管理。企业空间的封闭性质确保了数据的安全性和合规性,同时保障了敏感信息的保护。


与此相对,开放空间是一个开放的数据生态系统,它跨越不同行业和领域,促进组织间的协作和知识共享。开放空间通过强调数据透明度和标准化,支持灵活的数据访问和合作模式,推动跨领域的创新和技术交流。


    两者的主要区别在于:

• 参与主体企业空间服务于单一组织,而开放空间则面向多元组织的广泛参与者。


• 数据共享范围:企业空间限于内部共享,开放空间则扩展至跨组织和行业。


• 安全性与控制:企业空间提供严格的数据控制,开放空间则在开放性与数据保护间寻求平衡。


• 目的与应用:企业空间聚焦内部效率,开放空间鼓励跨界合作与创新。


    在实际应用中,企业空间可以被跨国公司用来加强全球分支机构间的协同,如汽车制造商利用该空间共享设计至客户反馈的全链条数据,实现生产效率的实时监控和市场响应的快速调整。


    开放空间则特别适合智慧城市等跨行业项目,政府通过整合多部门数据,不仅提升了城市管理的智能化,还通过数据分析为市民提供更精准的服务。同时,开放空间为初创企业和研究机构提供了丰富的数据资源,加速了新技术和解决方案的开发。

总结
可信数据空间的构建,旨在塑造一个坚如磐石的安全环境,让数据流通既顺畅又可控。借助数据使用控制技术、区块链等尖端科技的加持,这一空间实现了对数据访问的精细管理和对合规性的严格把控。它不仅保障了数据的完整性、机密性和可用性,而且促进了数据在不同机构和领域间的安全交换和深度利用。可信数据空间为数字经济的蓬勃发展、智慧城市的构建、科研创新的突破提供了坚实的数据支撑,构筑了信任的基石,为社会各领域带来深远的积极影响。
参考资料

[1]《IDS-RAM4》https://docs.internationaldataspaces.org/ids-knowledgebase/v/ids-ram-4

[2]《IDSA Rulebook》https://internationaldataspaces.org/publications/white-papers

[3]Eclipse Dataspace Components https://eclipse-edc.github.io/docs/#/READM.

[4]工业互联网产业联盟.可信工业数据流通应用案例集.2023

[5]北京金融科技产业联盟.金融数据可信流通技术白皮书.2023

[6]上海数据集团有限公司,华为云计算有限公司.城市数据空间CDS白皮书.2023

亚信科技新技术探索
亚信科技的ICT前沿技术观点与行业洞见。展现亚信新技术与产品行业实践成果。
 最新文章