【金猿案例展】苏州市卫生健康信息中心--基于隐私计算的医疗卫生机构数据安全共享应用

科技   科技   2024-11-19 08:31   北京  





绿盟科技数据要素案例
该数据要素项目案例由绿盟科技投递并参与数据猿年度金猿策划活动——2024数据要素产业年度创新服务企业榜单/奖项”评选




大数据产业创新服务媒体

——聚焦数据 · 改变商业




本案例从2020年开始建设构建一个集数据采集、存储、处理、分析于一体的医疗健康大数据中心,以提升医疗服务质量、促进医学研究、支持公共卫生决策等。苏州市医疗健康大数据中心建设的业务范围将涵盖全市所有公立医疗机构(三级、二级)、基层医疗卫生服务机构、公共卫生机构以及民营医疗机构(门诊、门诊部、医院、护理医院及各级各类药店)等。涉及的信息平台包括:已建成的苏州市区域卫生平台及下属区县的区域卫生平台、公共卫生平台、人口与计划生育平台以及各类医疗机构自有的各类自建医疗卫生信息系统等。

从2023年开始基于隐私计算的医疗健康数据共享应用研究与实践,通过搭建隐私计算平台,融合新兴的数据安全技术,在保证患者个人隐私不外泄、增强卫生健康数据安全性与监管效能的同时,完成数据的开放共享利用,促进地区医疗水平提升。通过数据流通机制的本质改进,快速、显著的助力地区医疗健康数据赋能与监管。

通过上述医疗健康数据这一数据要素的利用方案,实现了苏州卫健委汇集的医疗健康数据基于隐私计算的安全共享,使得苏州的医疗卫生机构、科研机构、生物制药企业、政府部门、保险公司、院校等得以基于这些海量的医疗健康数据进行相应的统计分析、科学研究、模型运算、决策支持等,从而将苏州海量的医疗健康数据安全应用起来,造福于民。

时间周期:

项目开始时间:2023年5月

中间重要时间节点:2024年1月

项目完结时间:2024年7月

数据要素价值需求


1、需求分析

根据国务院发布《“健康中国2030”规划纲要》、《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》、《关于促进“互联网+医疗健康”发展的意见》、《关于深入开展“互联网+医疗健康”便民惠民活动的通知》,结合江苏省《“健康江苏2030”规划纲要》、《关于推进我省人口健康信息平台建设的意见》等文件要求,加快建设统一权威、互联互通的大数据基础平台,拓展完善现有设施资源,强化应用信息系统数据采集、集成共享和业务协同。消除数据壁垒,畅通部门、区域、行业之间的数据共享通道,推动实现健康医疗数据在平台集聚、业务事项在平台办理、政府决策依托平台支撑。推动健康医疗大数据资源共享开放。鼓励各类医疗卫生机构推进健康医疗大数据采集、存储,加强应用支撑和运维技术保障,打通数据资源共享通道。建设统一归口的健康医疗数据共享机制。建立健康医疗数据资源目录体系,制定分类、分级、分域健康医疗大数据开放应用政策规范,稳步推动健康医疗大数据开放。

苏州市结合国家及江苏省规划策略,制定了《“健康苏州2030”规划纲要》、《苏州市“十三五”卫生与健康规划的通知》、《关于加快推进健康市民“531”行动计划信息化项目建设的通知》文件。旨在加强卫生与健康信息化建设,构建大数据基础平台互联互通和数据应用,建立和完善全员人口、服务资源、电子健康档案、电子病历和健康知识数据库,开展大数据深度挖掘与分析利用。

2、拟解决问题

自2009年我国政府发布《关于深化医药卫生体制改革的意见》以来,十多年的时间里,我国医疗体系信息化建设已取得显著成果。各级医疗机构已基本完成医疗服务与日常运营管理的信息化,中等规模医院基本配备CDSS等临床信息化支持系统;区域卫生平台与公共卫生系统等区域医疗信息化系统也取得了一定的进展。

信息化为患者、医务人员、医院乃至地方行政管理部门都带来了显著的便利。然而,在医疗数据收集与使用难度显著降低的同时,一方面,数据泄露与数据乱用的现象屡现不止;另一方面,各机构对数字资产的保护意识增强,担心造成法律纠纷而不愿将本地数字信息出域。由数据安全风险等顾虑所带来的医疗信息孤岛已成为阻碍区域医疗信息化与医疗水平持续提升的重要因素之一,也对《“十四五”优质高效医疗卫生服务体系建设实施方案》中要求的“推进跨地区、跨机构信息系统的互联互通”的实施造成一定的阻碍。

医疗数据兼有高敏感与高价值双重属性,如何在保证数据安全的情况下完成合规流通已成为不容忽视的挑战。为应对此类问题,国务院办公厅于2022年9月在《全国一体化政务大数据体系建设指南》中指出要“探索利用身份认证授权、数据沙箱、安全多方计算等技术手段,实现数据可用不可见”;国家发改委亦于《“十四五”推进国家政务信息化规划》中指出要“推进政务数据的算法式安全共享”。由此可见,促进医疗医疗数据安全流动应充分考虑使用好的技术和方案来解决。

面临挑战


在苏州市医疗健康大数据中心的建设与隐私计算数据共享应用的推进过程中,客户面临着多重严峻挑战,这些挑战深刻体现了在“数据要素”层面进行深度整合与优化的迫切性。首先,企业内部原有的组织架构相对分散,各公立医疗机构、基层医疗卫生服务机构及民营医疗机构间存在协调配合不畅的问题,导致数据流通壁垒重重,难以形成统一的数据管理体系。

更为关键的是,由于历史原因和技术限制,内外数据格式不统一,数据孤岛现象普遍,使得海量医疗健康数据被割裂,无法形成连贯、全面的数据视图。这种数据孤立状态不仅限制了数据价值的挖掘,还加剧了患者个人隐私泄露的风险,使得“数据要素”的安全性与合规性成为亟待解决的问题。

在“数据要素”拉通层面,客户需求迫切,希望打破数据壁垒,实现跨机构、跨领域的数据共享与利用。然而,如何在保证数据安全与隐私的前提下,实现数据的开放共享,成为摆在面前的一大难题。这不仅要求技术上的突破,更需要在数据治理、法律法规等方面进行全面规划与布局。

正是基于这些复杂而严峻的挑战,我们的服务方凭借先进的技术实力、创新的产品方案以及专业的服务能力,成功助力苏州市医疗健康大数据中心的建设与隐私计算数据共享应用的实践,实现了“数据要素”的安全、高效流通与利用,为苏州医疗健康事业的蓬勃发展注入了强劲动力。

数据处理


基于医疗健康大数中心大力推进市级全民健康信息平台及面向公众的卫生健康服务平台建设,汇集卫生健康数据175亿条,政务数据共享91.2亿条,“健康苏州掌上行”平台注册用户211万,累计线上支付金额超2.1亿元,2023年度各类服务点击量超1751万次。

在现代医疗数据处理中,数据的准确性和一致性至关重要。随着数字化医疗记录的普及,医疗数据的种类和来源变得多样化。然而,非结构化的医疗数据(如医生的手写笔记、病情判断等)给数据的使用和分析带来了巨大挑战。为了解决这些问题,本研究提出了一种基于大模型的医疗数据清洗方法,将非结构化数据转化为结构化数据,以便更好地进行数据分析和应用。

医疗数据的清洗和标准化对于以下几个方面具有重要意义:

1、提高数据质量:非结构化数据常常包含大量噪音和冗余信息,通过清洗可以提高数据的质量和可靠性。

2、促进数据共享和互操作:结构化数据更易于共享和集成,有助于不同医疗机构之间的数据互操作。

3、支持决策和分析:标准化的数据格式便于机器学习模型和其他分析工具的使用,提高决策支持系统的准确性和效率。

4、合规性和隐私保护:在清洗过程中,可以对敏感信息进行处理,确保数据的合规性和患者隐私保护。

长久以来,对医疗数据的清洗是一个极其耗费专家人力的活动。然而,近两年大模型技术的出现彻底解决了语义问题。在此情况下,我们使用新兴的大模型技术进行数据清洗。

图:基于大模型的数据清洗

应用技术与实施过程


1、技术解决方案

本案例以医疗健康大数据中心为基础,隐私计算技术为核心,结合云原生技术,通过多项技术创新与优化,构建了一个医疗健康数据要素安全流通云平台,为医疗健康大数据建设和共享应用的研究提供了坚实的安全调度基础。该平台能够广泛支持包括医学在内的数据采集和安全流转问题,确保数据在多源共享和流转过程中的安全性和隐私保护。

数据要素的茁壮成长离不开多源数据的共享流转,这与传统企业数据内部运维开发模式存在显著区别,天然带来了跨机构信任缺失与攻击面扩展的问题。如图所示,当数据跨域流转时,由于合作机构的安全能力与利益诉求的不一致,可能存在黑客、内鬼以及违约等多方面的安全风险。这些安全问题导致各参与方不愿意、不敢拿出数据,从而阻碍了数据的自由流通和价值发挥。

图:数据要素中数据跨域流转带来的安全问题

隐私计算提供了一种信息技术上的解决方案,它不依赖于传统的合约条款或人工监督,而是通过技术手段确保数据在整个流转过程中的安全和隐私。这一技术为数据要素的发展提供了有力支持,使得跨机构的数据共享应用成为可能,同时保障了数据的安全性和隐私性。同时,虚拟化与云原生技术已经成为现代信息技术架构的基础,本案例研究充分吸收两类技术的优势,并结合多项安全技术的创新优化,构建了一个医疗健康数据要素云平台,通过微服务架构、容器化部署、自动化运维等技术手段,能够实现医疗健康数据的高效、安全流转和处理。

2、技术研究总体框架

本案例中所研究的医疗健康数据要素云总体框架如图所示,其主要包含如下部分:

1)设施层:设施层以通用硬件或支持构建可信执行环境(TEE)的国产可信TEE芯片为基础,结合可信启动技术,构建可信/机密操作系统。此层为上层的数据存储与任务调度提供了可靠的底座,确保基础设施的安全性和可信性,从而为系统的整体稳定运行奠定了基础;

2)数据层:数据层支持各类主流数据格式的安全分布式存储与审计标识,确保数据在存储过程中的完整性和安全性。该层为上层业务调度数据做准备,通过文件系统、数据库引擎、数据仓库和数据湖等多种数据存储方案,满足不同应用场景的需求;

3)计算层:计算层结合隐私计算技术,进行数据的安全联合计算。针对不同的技术路线,构建多类型通用性强的计算引擎,包含联邦学习、多方安全计算、可信执行环境等,确保计算过程中的数据隐私和安全;

4)调度层:调度层支持用户侧的实际任务创建与调度,对业务提供方屏蔽隐私计算等困难技术的细节。该层支持预设任务与用户自定义任务,并允许与异地的要素云进行可信互联互通调度,确保任务在不同机构间的高效协同和安全执行。

5)应用层:应用层提供贴近实际业务的应用模板方案,为用户提供开箱即用的安全设计。该层涵盖联合医疗科研分析、安全医疗健康服务和可信数据空间等应用场景,旨在为用户提供便捷、高效的服务体验,同时确保数据的安性和隐私保护。

图:医疗健康数据要素云总体框架

在所提框架中,本案例对框架中各层次内容都进行了设计与研究,以确保所提技术的可用性与先进性,其中主要的技术突破点如图所示,下面我们逐层对其中涉及的具体技术进行技术论证。

图:医疗健康数据要素云技术研究与突破点

3、技术实现方案

本案例自底向上逐层描述数据要素云研究方案中所涉及的核心技术,简要阐述各层的设计和实现方法,重点阐述隐私计算层设计和实现方案。

1)医疗健康大数据中心基础建设

大数据中心基础平台包括:各类基础设施和云平台的新建和优化,如机房及配套设施、计算与存储、网络与通信、安全防护、云管理平台等;实现各类医疗机构和相关行业内外部数据采集与交换、数据存储;完善运维与安全体系等。大数据平台的建设将成为苏州市各类医疗健康数据的统一、权威汇集地,是苏州市医疗健康大数据开放、共享、应用的基础。

配套支撑:梳理医疗健康大数据中心建设所需遵循的数据标准清单、及标准建设模板等,用以指导并规范全市范围内医疗健康数据的采集、交换与服务共享,支撑数据质量管理与提升。构建数据主题库、数据基础服务和大数据挖掘服务,形成数据与应用支撑平台。梳理大数据中心建设与运营的数据治理体系,从流程、组织方面为数据质量提升提供制度保障。规划数据治理体系总体框架和核心管控流程,设计基本的数据治理组织、角色、职责、能力要求以及相应的运作机制等。

应用规划与建设:基于大数据平台中的苏州市全量医疗健康数据、平台提供的数据基础服务、大数据分析与挖掘能力,结合居民、医疗卫生机构和医疗卫生行业监管相关业务需求,明确大数据中心应具备的业务能力,所承载的数据资源目录,设计相关数据模型,规划和建设协同应用、业务质控、影像云及远程医疗服务等。

2)数据采集交换

数据采集交换实现了全市各类医疗机构和其他医疗卫生单位的源数据汇聚,源数据采集的类型支持传统关系数据如Oracle、MySQL、PostGresQL、Hadoop、Hive、MPPDB,以及半结构化文件、非结构化文件、流式消息数据等。采集后的原始医疗健康数据统一存入大数据资源池HDFS、Hbase、Hive等。源数据采集从采集格式上支持文件、数据库、流数据等多源数据类型。

对于定时与实时数据采集,大数据中心基础平台从功能上提供高可用的,高可靠的,分布式的海量日志采集、聚合和传输。具备支持在日志系统中定制各类数据发送方,用于收集数据,同时提供对数据进行简单处理,并写到各种数据接受方的能力。

对于批量与增量数据集成,大数据中心基础平台能与关系型数据库、文件系统之间交换“数据”、“文件”,同时也可以将数据从关系型数据库或者文件服务器导入到基础平台的HDFS/HBase中,或者反过来从HDFS/HBase导出到关系型数据库或者文件服务器中。

共享与服务的传输加密采用发布订阅、点对点、路由转发等数据交换机制。通过在前置节点之间通信采用128位的SSL技术,在各共享单位之间建设VPN通道,在共享单位间进行可靠传输,确保连接的合法性、私有数据的保密性;平台内部的各个组件,如HDFS、Hive在进行数据传输的时候,可以通过加密手段对通信协议进行保护。

作为苏州市所有医疗卫生信息存储及共享的依托。整合全市医疗卫生机构数字化医院信息系统、公共卫生信息系统、基层卫生信息系统等的医疗卫生数据等。通过统一卫生健康信息标准规范,将这些分散存储、形式各异的数据进行整合和交换。

3)运维及安全

大数据中心基础平台的运维管理实现对运维信息(如告警信息、性能信息等)的综合分析和呈现。云管平台一云多池、异构VMWARE资源池、混合云管理,通过统一管理、统一资源调度,完成一朵云的统一运维。云运维管理包含告警管理、统一监控、资源管理、性能管理、敏捷报表、容量管理、大屏展示等功能模块,对日常运维、系统变更、运营分析等运维业务场景,实现多个数据中心与混合云的集中运维管理。

4)隐私计算设施层

通用x86等物理服务器的虚拟化技术已经有数十年的发展历史,然而为解决数据要素中的跨域流转问题,传统的虚拟化方案无法支持。其中,一个长期以来存在的问题是,资源的提供者能够窃取资源,即宿主机能够窃取虚拟机中的资源。为了应对这一挑战,本方案提出了基于可信芯片的机密虚拟化方案,以确保数据的安全性和隐私性。

基于可信芯片的机密虚拟化方案研究

为了防止恶意攻击者通过宿主机获取虚拟机数据,本方案研究并实现了一种对虚拟机的机密加固方案。该方案以国产高安全通用处理器为基础,充分利用其内置的安全芯片模块,从底层构建可信执行环境,实现对虚拟机的内存加密。方案架构如图所示,自底向上分为硬件层、Hypervisor(虚拟机监控器)、启动与运行时安全机制等多个层次。

图:机密虚拟机启动方案图

硬件层以x86架构服务器为载体,内置专用安全芯片,提供机密计算的基础能力。这些芯片通过硬件加密和可信启动技术,为虚拟机提供强大的安全保障。Hypervisor承担虚拟机管理和调度职责,负责为虚拟机分配CPU、内存等物理资源,并对虚拟机进程采取隔离措施,防止虚拟机间非法访问。Hypervisor还利用虚拟化扩展技术,确保虚拟机运行环境的安全性和隔离性。

在启动阶段,通过BIOS中的可信度量技术,对虚拟机系统镜像文件进行度量和验证,以保证启动链的完整性。具体而言,利用OVMF(Open Virtual Machine Firmware)等固件技术建立可信启动链,将度量值通过TEE机制安全传递给远程验证方,实现可信启动。可信启动过程中,系统会对启动组件进行度量,并将结果存储在安全芯片中,以供后续验证。

在虚拟机运行期间,系统持续对虚拟机内存进行加密,从而彻底杜绝窃密风险。该功能借助CSV(Chinese Secure Virtualization)技术,通过为每个虚拟机实例生成独立的密钥,在PSP(Platform Security Processor)安全芯片中完成内存数据的加解密操作。这种方式无需修改虚拟机操作系统和应用,同时通过Confidential Guest Support等机制,严格限制宿主机对虚拟机内存的访问。

为了支持跨安全域的可信交互,系统还支持对虚拟机完整性进行远程证明。具体做法是基于QEMU的qmp协议,由虚拟机主动发起证明请求,将OVMF测量结果通过专用API发送给远端认证服务器。认证服务器通过验证这些测量值与预置的参考值是否一致,来判断虚拟机的可信状态。

综上所述,通过证书链的逐层认证与构建,本案例研究的机密虚拟化方案从硬件、管理程序、启动与运行时等多个层面构建了完整的信任链,显著提升了虚拟化系统的整体安全性,为高安全等级跨域数据流转提供了坚实基础。

5)隐私计算数据层

数据要素的核心在于数据的存储、治理和保护。现代企业中,数据的存储格式通常包括文件、数据库、数据仓库和数据湖四类,其中后两者通常用于大规模数据存储。对于大规模数据,单块硬盘或单台物理机无法满足需求,这时需要采用分布式存储方案。

由于上层虚拟机需要在系统调用时获取明文数据,因此通常采用透明加密的方式进行代理。对于单块硬盘的透明加密已有许多成熟方案,但对于多个块设备组成的硬盘乃至分布式硬盘组成的存储集群,缺乏高效可行的国密加密方案,本案例对此进行了深入研究。

在数据库使用方面,传统的安全方案通常通过堡垒机等代理方式进行高权限账户密码代填等安全保护,但缺乏原生透明的保护方法。本案例从数据要素的视角出发,设计了一种代理方案,能够以高权限完成数据保护。

在数据价值清洗方面,医学数据库中常常带有医生诊断、病情简述等主观性强、无法作为分析属性或标签的字段,传统的解决方法需要大量专家人力对此进行统一处理。本案例结合前沿的大模型技术,设计了一种自动化的数据清洗方案。

下面对这三个研究点所使用的技术方案进行详细说明。

图:基于对象存储的透明加密文件系统方案

6)数据要素视角下的数据库代理研究

在当前数据密集型业务环境中,数据要素的安全和可控共享成为关键议题,而数据库是最重要的数据承载形式。随着数据流通和交易的日益频繁,如何在数据库层面实现数据流转的安全控制变得尤为重要。数据库作为主要的数据存储方式,亟需有效的技术方案来保障数据在流通过程中的安全性和可控性。

现有技术主要包括两类数据库访问控制方法。一类是通过堡垒机等工具进行内部运维记录和密码代填。通过预置密码到堡垒机并由堡垒机自动填写密码,这种方法避免了使用者直接接触数据库密钥。另一类是通过数据库代理技术,对数据库的上行和下行流量进行报文改写。例如,外部客户端的请求首先到达数据库代理,代理获取并改写SQL报文,再传递给实际的数据库引擎进行处理,最后将处理结果传回客户端。

然而,这些现有技术存在明显的局限性。对于堡垒机等密码代填方案,其主要适用于内部运维场景,在跨机构数据流通时,难以实现录屏监控或实时流量截断。而现有的数据库代理技术,通常仅用于数据脱敏,无法有效应对数据流转交易的需求。

针对上述问题,本研究提出了一种面向数据可控共享的数据库代理技术方案。该方案通过几类策略,旨在提高数据库代理的效率和安全性,特别是仅通过上行流量改写实现策略的执行。这些策略不仅适用于主流关系型数据库(如MySQL、PostgreSQL),也适用于部分非关系型数据库(如MongoDB)。

首先,针对数据可控共享和流转,本研究提出了四类代理管控策略:

1. 控制数据库的使用时间:通过设置授权信息中的有效期字段,确保在授权时间内能够正常访问数据库,超出授权时间则自动阻止访问。

2. 控制数据库的查询次数:每次查询减少一次剩余查询次数,当剩余次数为零时,阻止进一步的查询请求。

3. 控制每次查询返回的数据行数:通过改写SQL语句,限制每次查询返回的数据行数,防止一次性获取过多数据。

4. 控制数据库可查询内容的总大小:通过统计下行流量的字符数,确保查询返回的总数据量不超过预设限制。

这些策略的核心在于为数据库拥有者提供简单直观的控制方式,以保障使用者能够正常使用数据库内容,同时防止批量数据窃取。

数据库代理实现结构主要分为三部分:

1. 数据库对外服务模块:包括数据库引擎和数据库代理。所有访问请求先传输到数据库代理,代理解析流量并根据改写规则进行SQL报文改写,再传递给数据库引擎处理。处理结果返回代理,由代理传回客户端。

2. 数据库客户端:包括数据库管理工具(如Navicat)和业务代码中的数据库调用工具(如Java的数据库驱动)。无论哪种工具,最终都会以SQL报文形式将请求传输给数据库代理。

3. 外部授权控制模块:用于代理授权的外部工具,主要负责将授权信息写入数据库对外服务模块。该模块可以是轻量级的Web端或客户端工具,核心在于触发数据库对外服务模块中的改写规则,将授权信息存入配置存储模块。

如图所示,数据库对外服务模块包括以下组件:

图:面向数据要素流转的数据库代理模块结构

1. 数据库引擎:标准的数据库模块,如MySQL、PostgreSQL、MongoDB等。

2. 数据库代理:通常使用高性能编程语言(如C/C++)实现,负责报文解析与转发。代理解析出关键内容(如用户账户名、数据库名、实际SQL等),并根据改写规则进行SQL报文改写。

3. 改写规则模块:实现具体策略,接收原始SQL报文并根据用户信息、数据库信息等进行改写。

4. 配置存储模块:存放外部授权派发的实时信息,通常使用轻量高效的键值对数据库(如Redis、etcd、tikv)实现。

服务效果


1、社会效益及经济效益

基于医疗健康大数中心大力推进市级全民健康信息平台及面向公众的卫生健康服务平台建设,汇集卫生健康数据175亿条,政务数据共享91.2亿条,“健康苏州掌上行”平台注册用户211万,累计线上支付金额超2.1亿元,2023年度各类服务点击量超1751万次。不仅有助于提升医疗服务效率和质量,促进健康管理和预防保健,还能加强公共卫生应急响应能力,推动政务数据共享与开放,提升公众健康素养和参与度,从而实现显著的社会效益。

提升医疗服务效率和质量:通过全民健康信息平台,医疗机构能够更高效地管理和分析患者的健康数据,为医生提供更准确的诊断依据,从而提高医疗服务的质量和效率。同时,平台还可以实现医疗资源的优化配置,减少医疗资源的浪费,提高医疗服务的可及性。

促进健康管理和预防保健:平台能够汇集和分析大量的卫生健康数据,为制定针对性的健康管理策略和预防措施提供依据。通过提供个性化的健康指导和干预,平台可以帮助公众更好地管理自身健康,预防和控制疾病的发生。

加强公共卫生应急响应能力:在突发公共卫生事件发生时,全民健康信息平台能够迅速汇集和分析相关数据,为政府决策提供科学依据,提高应急响应的及时性和准确性。同时,平台还可以实现医疗资源的快速调配和协调,提高应对突发事件的能力。

推动政务数据共享与开放:通过政务数据共享,可以打破信息孤岛,促进政府部门之间的协同合作,提高政府服务的效率和质量。同时,数据的开放还可以为科研机构、企业等提供更多创新和应用的可能性,推动相关产业的发展。

提升公众健康素养和参与度:面向公众的卫生健康服务平台可以提供便捷的健康咨询、预约挂号、健康教育等服务,增强公众的健康意识和自我保健能力。同时,平台还可以收集公众的反馈和建议,为政策制定和改进提供参考,提高公众的参与度和满意度。

在经济效益方面苏州市医疗健康大数据中心其中仅影像平台已直接存储1288.6万例检查,图像量36.0亿张。存储检查索引1857.6万例。数据总存储量1420TB。医院间调阅图像5.97万次、报告8.18万次,提供移动端调阅349.5万次,有效避免了市民大量的重复检查。按CT检查平均500元/人次,节省检查费用近3000万元;按CT胶片13.6元/张,人均2张胶片计算,节省胶片费用超9000万元,仅影像平台的数据共享与调阅产生的经济效益超过1.2亿元。

图:大数据中心影像云数据展示

2、推广意义

在当前大数据时代,数据安全已成为社会经济发展和科技进步的基础性保障。通过本案例的研究成果,利用隐私计算技术可以有效解决数据存储、传输和计算过程中的安全问题,保护用户隐私,防止数据泄露和滥用。这对增强公众对数据使用的信任度,促进数据的合法合规流通具有重要意义。

个人隐私保护:随着互联网和移动技术的发展,个人数据的采集和使用变得越来越普遍。本案例通过创新的隐私计算技术,能够在不侵犯个人隐私的前提下,进行数据分析和处理,保护用户的隐私权利。

企业数据安全:企业的数据安全是其核心竞争力的重要组成部分。通过本案例的技术,企业可以在保护商业机密和敏感数据的同时,进行跨组织的数据合作和共享,提升业务创新能力。

政府数据治理:政府在数据治理中需要处理大量的敏感信息,如居民身份信息、健康数据等。本案例的技术可以帮助政府在确保数据安全的前提下,提升数据治理能力和公共服务水平。

3、隐私计算能力保障数据安全

在当前大数据时代,数据安全已成为社会经济发展和科技进步的基础性保障。通过本案例的研究成果,利用隐私计算技术可以有效解决数据存储、传输和计算过程中的安全问题,保护用户隐私,防止数据泄露和滥用。这对增强公众对数据使用的信任度,促进数据的合法合规流通具有重要意义。

个人隐私保护:随着互联网和移动技术的发展,个人数据的采集和使用变得越来越普遍。本案例通过创新的隐私计算技术,能够在不侵犯个人隐私的前提下,进行数据分析和处理,保护用户的隐私权利。

企业数据安全:企业的数据安全是其核心竞争力的重要组成部分。通过本案例的技术,企业可以在保护商业机密和敏感数据的同时,进行跨组织的数据合作和共享,提升业务创新能力。

政府数据治理:政府在数据治理中需要处理大量的敏感信息,如居民身份信息、健康数据等。本案例的技术可以帮助政府在确保数据安全的前提下,提升数据治理能力和公共服务水平。

4、创新技术提升数据分析效率和效果

本案例通过低代码技术和高效的调度引擎,降低了数据分析的门槛,提高了数据分析的效率和准确性。更重要的是,通过联合多方数据资源,提升了数据分析的效果和深度。数据分析效率和效果的提升,对各行各业的数据驱动决策和创新具有重要推动作用。

1)医疗领域:

数据整合:通过本案例的技术,医疗机构可以安全地整合患者数据,形成更大规模和更高质量的数据集,提升医学研究的深度和广度。

精准医疗:利用更丰富的数据资源和高效的分析工具,医生和研究人员可以更准确地进行疾病诊断和治疗,提高医疗服务质量。

医学研究:通过联合多家医疗机构的数据,提升机器学习模型的训练精度,加速医学研究的进展。

2)金融领域:

风险管理:通过高效的数据分析,金融机构可以实时监控市场风险,优化风险管理策略,提升市场稳定性。

客户分析:利用多源数据,金融机构可以更全面地了解客户需求,提供个性化的金融产品和服务,提高客户满意度和市场竞争力。

欺诈检测:通过实时的大数据分析,快速发现和防止金融欺诈行为,保障金融系统的安全。

3)制造业:

生产优化:通过整合和分析生产数据,可以优化生产流程,提升生产效率,降低成本,推动智能制造的发展。

质量控制:利用丰富的数据资源和高效的分析工具,实施精准的质量控制,提升产品质量,减少返工和废品率。

供应链管理:通过全方位的数据分析,优化供应链管理,提升供应链的响应速度和效率。

4)公共服务:

智慧城市:通过对城市各类数据的整合和分析,优化城市管理和服务,提高城市运行效率和居民生活质量。

交通管理:利用实时交通数据分析,优化交通管理策略,缓解交通拥堵,提高交通安全。

环境保护:通过对环境数据的实时监测和分析,及时发现环境问题,制定和实施有效的环境保护措施。

相关企业介绍


·苏州市卫生计生统计信息中心

苏州市卫生健康信息中心成立于2009年9月4日,其主要职责包括提供卫生健康信息服务,提高数字健康水平,拟定卫生健康信息化技术标准,组织实施卫生健康信息化项目,指导各市、区卫生健康信息化建设工作,进行卫生健康应用系统、网络与信息安全相关建设管理,以及卫生健康数据管理、分析和应用等。此外,该中心还负责12320卫生热线运行管理,开展卫生健康信息技术交流和继续教育培训。经过多年的建设,该中心已经建立了相对及时、准确、完整、规范的电子健康档案平台,为居民健康管理提供了有力支持。

·绿盟科技

绿盟科技集团股份有限公司成立于2000年4月,总部位于北京。公司于2014年1月29日在深圳证券交易所创业板上市。绿盟科技在国内设有50余个分支机构,为政府、金融、运营商、能源、交通、科教文卫等行业用户与各类型企业用户,提供全线网络安全产品、全方位安全解决方案和体系化安全运营服务。公司在美国硅谷、日本东京、英国伦敦、新加坡及巴西圣保罗设立海外子公司和办事处,深入开展全球业务,打造全球网络安全行业的中国品牌。

数据猿
关注大数据产业的技术应用新媒体。数据猿致力于以大数据的产业应用视角,关注报道金融、工业、医疗、消费等为代表的全行业,并以大数据视角,重点关注人工智能与云计算领域。数据猿也将持续关注物联网、半导体、新能源等重要领域的大数据技术应用及发展情况。
 最新文章