在数据为王的时代,信息数据是推动社会脉动的强大力量,同时,也带来了信任缺失与安全威胁双重挑战。在这场数据革命浪潮中,“可信数据空间”应时而出,作为数据流通领域的未来基础设施,其筑起了数据安全流通的坚固桥梁。期望本文能为关注数据领域的从业者与学者提供一定参考。
早在2016年,德国弗劳恩霍夫协会前瞻性的提出了“数据空间”这一创新概念。随后,在国际数据空间联盟(IDSA)的不懈推动与拓展之下,这一理念逐步从专注工业领域的“工业数据空间”跃升为更加宽广的“国际数据空间”(IDS),跨越国界,连接全球。在此基础上,中国信息通信研究院两化所与工业互联网产业联盟携手合作,中国信息通信研究院在此基础上,结合本土实践,提出了“可信数据空间”(TDM)的概念。TDM不仅继承了IDS的核心理念,即在数据主权原则下构建安全、受保护的数据流通环境,还进一步强化了数据流通的安全性、透明度和效率。TDM通过体系化的技术安排,如数据使用控制、数字身份认证、数据合约数字化等,确保数据流通协议的确认、履行和维护,解决了数据要素提供方、使用方、服务方、监管方等主体间的安全与信任问题。
如图所示,IDS参与角色包含:
• 核心参与者包含数据供需方;
• 中间机构包含身份认证机构、数据中介、应用商店、词汇中介、票据交换所等;
• 软件开发者包含应用开发者和连接器开发者;
• 空间治理机构包含认证机构和评估设施以及标准化组织。
图2:国际数据空间的核心组件
如图所示,IDS核心组件包含:
• 连接器(Connector)是数据空间中联通数据与服务的网关,也为各应用程序(App)和软件提供可信任的运行环境。
• 身份提供组件(Identity Provider)创建、维护和管理一个数据空间内参与者的身份信息及其有效期。
• 合约磋商组件(Contract Negotiation)提供包含创建和协商在内的合约管理服务。
• 策略引擎组件(Policy Engine)负责按数据合约条款执行数据使用策略。
• 策略监测组件(Monitoring)负责跟踪并反馈策略执行情况。
图3:可信数据空间的应用架构
如图所示,可信数据空间主要包含以下观点:
• 利益相关方:数据提供方、数据使用方、第三方服务提供方和监管方。
• 数据类型:公共数据、企业数据、个人数据和其他数据
• 流通模式:包含集中式和联邦式。
可信数据空间能够有效解决数据流通中的安全与信任问题,其具备以下特点:
1. 可信
• 参与方身份可信:对参与数据流通各类组织、用户、软件、APP、平台等进行身份认证,降低参与主体间的信任沟通成本。
• 流通对象可信:数据来源合法、质量可靠、流通方式合规。
• 流通环境可信:流通环节安全,数据在流通过程中不会被篡改。
2. 可控
• 合约捍卫数据主权:依托区块链等先进技术,将数据使用权、访问范围及期限等核心要素编码入智能合约,为数据资产穿上“智能锁”。
• 精细化数据权限管控:数据供需方通过智能合约明确界定数据使用的具体条款与条件,实现权限设定的自动化与执行的智能化。
3. 可证
• 日志记录透明可证:操作日志记录关键处理节点,并通过区块链存证加固日志的不可篡改性,为数据交互的历史留存不可磨灭的数字指纹。
• 日志开放追溯无忧:日志便捷查询帮助供需双方自证明晰,保障任意方数据权益不受侵犯。
如下表所示,数据流通领域根据流通模式可分为L0~L3四个级别,传统的数据空间聚焦于L1明文可控的流通模式,近期可信数据空间开始向L2密态计算模式延伸。
本文围绕基于数据使用控制等技术的L1模式开展研究,提供明文可见、精细管控的跨域流通服务。
(一)制造业
图4:制造业的数据空间场景
• 智能制造:利用可信数据空间技术,实现设备和设备之间的数据共享和协同,提高生产效率和降低生产成本。比如通过数据空间实现设备之间的实时数据采集和共享,实现智能制造。
• 质量控制与预测维护:利用可信数据空间技术收集和分析设备和产品的数据,检测生产过程中的异常情况,提前预测设备的维护需求,从而降低故障率,提高产品质量。
• 供应链协同:制造业的供应链中涉及众多合作伙伴和环节,通过可信数据空间技术实现供应链信息的共享与协同,可以提高供应链的透明度和响应速度,降低库存与成本。
• 产品追溯与溯源:利用可信数据空间技术,追溯产品从原材料到成品的整个生产过程,检测产品的生产历史和来源,实现产品的全程追溯和溯源。
可信数据空间在制造业领域的应用可以帮助企业实现智能制造、提高生产效率、优化产品质量、降低成本以及实现供应链协同等目标。通过数据空间技术的应用,制造业可以实现数字化转型,提升竞争力。
(二)金融业
图5:金融行业的数据空间场景
• 风险管理与监控:利用可信数据空间技术整合各类数据源,包括客户数据、市场数据、交易数据等,进行风险分析和监控。通过数据空间平台实现对金融风险的实时监测和预警,提高风险管理效率。
• 反欺诈与安全:利用可信数据空间技术整合海量数据,实现欺诈行为的识别和预防。通过分析数据空间中的交易记录、行为模式等数据,帮助金融机构识别潜在的欺诈风险。
• 资产管理与投资决策:利用可信数据空间技术整合市场数据、企业财务数据等各类数据源,为资产管理和投资决策提供数据支持。通过数据空间技术实现对市场趋势和投资风险的分析,帮助投资者做出更加准确的决策。
• 合规与监管:金融机构需要遵守严格的法规和监管要求,可信数据空间技术可以帮助金融机构整合各类监管数据,实现对金融交易和操作的全面监控,确保合规性。
通过数据空间技术的应用,金融机构可以提高风险管理能力、优化业务流程、提升客户体验,同时满足监管要求,促进金融业务的创新和发展。
(三)政务行业
在政务行业,特别是在公共数据授权运营场景下,可信数据空间作为一种集成的数据管理和交换平台,为政府机构提供了安全、合规的数据存储、处理与共享环境,应用于城市治理、公共服务、产业赋能等多个维度,可有效促进了政务数据价值的挖掘与释放,加速了数字化政府转型和服务型政府建设。
• 数据共享与互联:政府部门拥有大量的公共数据资源,通过可信数据空间技术建立数据共享机制,实现不同部门之间数据的互联互通。不同部门之间可以共享数据、资源和信息,提高政府机构之间的协同工作效率。
• 政务决策支持:政府可以利用数据空间技术整合各类公共数据,进行数据分析和挖掘,为政府决策提供支持。政府部门可以通过可信数据空间平台获取多维度的数据信息,更好地了解社会经济状况和民生情况,做出更科学的政务决策。
• 智慧城市建设:可信数据空间技术可以帮助政府建设智慧城市,实现城市各类数据的整合和共享。通过数据空间平台实现城市基础设施的监控、数据分析、城市规划等,提高城市管理的智能化水平。
• 服务优化与个性化:利用可信数据空间技术整合公共服务数据,为市民提供更优质、更个性化的公共服务。政府可以通过数据分析和挖掘,了解市民需求并制定个性化的政策和服务方案,提升市民满意度。
通过可信数据空间技术在政务行业的应用,政府可以提升政务效率、加强数据治理能力、提升公共服务水平,促进政府治理的现代化和智能化发展。同时,可信数据空间也可以促进政府与市民、企业之间的更加紧密互动和合作,实现共赢局面。
(一)数字身份认证
可信数据空间系统采用分布式身份管理方案,并允许用户定制信任锚(信任锚是验证身份和建立信任关系的基础软件设施),提高身份管理的灵活性和安全性,允许用户根据自己的需求和安全策略定制信任锚。可信数据空间的身份认证主要包括以下步骤:
• 身份认证(Authentication):身份认证是验证用户、设备或系统身份的过程,确保他们是他们声称的那个人或实体。通常使用用户名和密码、数字证书、生物识别技术(如指纹或面部识别)等方法进行认证。在数据空间中,身份认证确保只有经过验证的用户才能访问或操作数据。
• 授权(Authorization):授权是在身份认证之后的一个步骤,它决定了经过认证的用户可以访问哪些资源以及可以执行哪些操作。授权过程通常基于角色的权限控制(RBAC)、属性基的访问控制(ABAC)或更细粒度的策略定义。授权确保用户只能访问他们被允许的数据和执行他们被授权的操作。
• 访问控制(Access Control):访问控制结合了身份认证和授权,通过定义明确的规则来控制对数据和资源的访问。访问控制可以是静态的,也可以是动态的,根据用户的行为、环境条件或数据的敏感性来调整访问权限。
(二)数据合约数字化
传统的数据交换合约是基于法律框架下签署保密协议或客户授权书,以非结构化文本的方式作为数据流通的凭证附件进行管理。数据合约数字化技术是在数据交换平台上将传统的纸面化合约通过安全软件实现在线签署和传输,签署完成后由数据交换平台各组件根据合约签订条件执行。
(三)数据使用控制
数据使用控制技术是数据空间中最核心的技术,是对传统访问控制机制的扩展,支持复杂的策略控制要求,是实施数据流通后数据权益保护的关键机制。传统的访问控制的规则粒度较粗,一般到明确的对象粒度,决策结果通常也只有允许和拒绝。使用控制策略匹配的规则颗粒度细化到对象的属性,而且决策的结果是多分支的,可以结合数据权益保护的要求实现多种策略结果。例如可以控制数据使用方在指定的时间范围、地域才能访问数据,并发送数据的使用结果到数据权益方。
数据使用控制模型定义了常用的“4W2H”6类数据管控维度,包括Who、When、Where、Do What、How to、How many,在每个维度上可以进行更细粒度的数据使用管控和控制策略组合,例如阅后即焚、定时访问、定点访问、定量访问等。
图8:数据使用控制策略
常见的使用控制能力如下表所示。
(四)数据存证溯源
(一)方案框架
亚信科技数据空间基础设施由流通服务平台和数联终端组成,分别在运营侧和数据供需侧部署。
图9:数据空间的方案框架
(二)方案特点
可信数据空间解决方案紧密围绕“五可”原则设计,旨在构建一个高度灵活、安全可控且高效利用的数据管理与流通生态系统,具有以下特点:
(三)适用场景
可信数据空间解决方案为构建高效的数据流通生态提供了新途径。它支持创建两种主要的数据共享环境:企业空间和开放空间,各自服务于不同的需求和目标。
企业空间是为单一企业或政府机构量身定制的封闭环境,允许组织内部部门安全地共享和交换数据。它旨在加强内部协同,提升决策效率,加速产品迭代,并优化流程管理。企业空间的封闭性质确保了数据的安全性和合规性,同时保障了敏感信息的保护。
与此相对,开放空间是一个开放的数据生态系统,它跨越不同行业和领域,促进组织间的协作和知识共享。开放空间通过强调数据透明度和标准化,支持灵活的数据访问和合作模式,推动跨领域的创新和技术交流。
• 参与主体:企业空间服务于单一组织,而开放空间则面向多元组织的广泛参与者。
• 数据共享范围:企业空间限于内部共享,开放空间则扩展至跨组织和行业。
• 安全性与控制:企业空间提供严格的数据控制,开放空间则在开放性与数据保护间寻求平衡。
• 目的与应用:企业空间聚焦内部效率,开放空间鼓励跨界合作与创新。
[1]《IDS-RAM4》https://docs.internationaldataspaces.org/ids-knowledgebase/v/ids-ram-4
[2]《IDSA Rulebook》https://internationaldataspaces.org/publications/white-papers
[3]Eclipse Dataspace Components https://eclipse-edc.github.io/docs/#/READM.
[4]工业互联网产业联盟.可信工业数据流通应用案例集.2023
[5]北京金融科技产业联盟.金融数据可信流通技术白皮书.2023
[6]上海数据集团有限公司,华为云计算有限公司.城市数据空间CDS白皮书.2023