摘要
Summary
为帮助金融机构做好分布式分析型数据库产品的选型,推广在金融行业部署应用分布式分析型数据库的成功经验,GBASE南大通用在北京金融科技产业联盟的指导下编写《南大通用GBase 8a金融应用指南》。(点击获取完整版指南)《指南》深入介绍了分布式分析型数据库从选型规划、开发设计规范、数据安全高可用,直至运维优化的部署全过程,并介绍了GBase 8a MPP Cluster在国家政策性银行和国有大行的代表性部署案例。
GBASE南大通用将陆续推出系列文章,分享解读《指南》内容,希望能够对广大金融用户的数据库选型提供借鉴帮助,助力科技金融的高效实施和高质量发展。本篇是系列文章的第7期,介绍数据安全和高可用。
1、数据安全
在诸多行业中,金融行业的数据安全要求是最高级别的。GBase 8a产品提供了数据流转中各方面的安全措施:从数据入库对数据源的安全认证,到数据入库传输加密、数据入库存储加密,到用户取数据的连接加密、用户权限检查,到库内数据脱敏,到最终数据交付用户,全面保护用户数据的安全和隐私。
GBase 8a 安全功能概览如图1所示。
图1 GBase 8a 安全功能概览
1、数据脱敏
用户数据中含有敏感字词,希望敏感信息在无权查看的人员面前以掩码形式显示,可以使用动态数据脱敏功能。
动态数据脱敏不会真正改动表中存储的实际数据,是通过脱敏函数给需要进行数据脱敏的字段添加脱敏属性,给字段中的敏感信息设置掩码,并通过用户权限控制,决定是否对有查询要求的用户暴露原始数据。
支持的脱敏函数如表1所示.
表1 脱敏函数
2、透明存储加密
GBase 8a默认数据在磁盘上存储的是非加密形式。对要求数据加密存储的场景,可以使用GBase 8a的透明存储加密功能让数据加密后落盘存储。
GBase 8a透明存储加密功能是实例级的,整个实例创建一份秘钥证书,对实例内所有带加密关键字标识的表或列的数据在后台自动加密和解密。加密算法可选择AES或SM4。
数据加密功能和原理如图2所示。
图2 数据加密概览
GBase 8a产品还提供加解密的系统函数,供业务sql处理临时、小范围的业务数据加解密:
AES_ENCRYPT(str,key_str)、ENCRYPT(str[,salt])、MD5(str)、SHA1(str)、SHA(str)、to_base64(str)
3.用户及权限管理
GBase 8a MPP Cluster数据库权限管理系统根据访问控制列表对所有连接、查询和其它操作进行安全管理。权限管理系统认证连接到GBase 8a MPP Cluster数据库实例的用户和用户拥有的权限,权限系统保证用户只执行允许做的事情。当用户连接到服务器时,用户身份就由发起连接的主机和指定的用户名来共同决定。连接成功后发起命令,权限系统根据用户身份和发起的命令类型决定是否授予执行权限。
GBase 8a产品的权限一共5大类:数据库对象操作类权限、数据操作类权限、存储过程和自定义函数执行权限、数据查看类权限、数据库(包含用户管理)管理类。
2、集群高可用
数据安全除了数据访问和传输安全的保护外,也包括数据防护保障,即使用数据备份、异地容灾等手段保证数据的安全。
1.数据高可用—副本可配置
GBase 8a集群安装时可配置用户数据存储的副本数量,副本数量可以配置1个、2个或者3个。副本数量多,用户数据安全性高,所需磁盘空间也越大。
2.数据高可用—备份恢复
GBase 8a MPP Cluster的备份恢复工具(gcrcman)提供集群整体、库级、表级的全量/增量备份恢复功能。
GBase 8a集群中用户数据已有1份至2份副本保障数据完整和业务连续,一般情况下不建议再使用备份恢复工具在本地(集群各节点)对集群中所有用户数据做备份,在下列场景中建议考虑使用备份恢复工具(gcrcman):
• 8a集群中部分重要的表,建议使用gcrcman工具做备份;
• 8a集群中的历史数据可以使用gcrcman工具备份到HDFS、S3等文件系统中。
3.数据高可用—连接高可用
应用使用GBase API或者gccli工具连接8a 集群,可填写多个Gcluster节点IP,实现连接高可用,避免单点性能瓶颈和单点故障。
4.集群双活(同数据中心)—GBase 8a虚拟集群镜像
集群双活是用于一个集群因故障无法服务时,能及时切换到另一个集群提供服务,同数据中心的双活使用了虚拟集群镜像技术实现,双活的两个集群距离较近,一般在同一机房或者同一幢楼中。
虚拟集群的镜像功能有以下特点:
灵活的镜像配置:支持库级、表级镜像设置;
数据实时同步:对具备镜像关系的库、表进行数据变更时两边实时同步。互为镜像的库下所有表都将自动创建镜像。库下所有函数、存储过程和视图都会同步在目标库下创建;
5.集群双活(同城、异地灾备)—GBase 8a集群间同步工具
集群双活(异地灾备)使用了集群间同步工具(GVR)实现,可用于距离较远的异地灾备。
集群间同步工具用于两个结构相同的物理集群之间数据的全量、增量同步,是底层数据文件的二进制同步的工具。通过该工具能实现两个物理集群之间的灾备架构搭建。
6.两地三中心
一般用于本地实时同步提升服务能力、异地异步同步保障数据安全的场景。
综合使用虚拟集群镜像技术和GVR工具,主数据中心的两个VC互为镜像,提高服务能力的同时也提高数据安全,异地数据中心的备集群VC提高数据的灾备安全能力。
本期撰稿 | GBase 8a产品部
本期编辑 | Suse
内容审核 | 生态发展部