2024
01/11
RUIHE DATA
Case Study
[ 案例分享]
瑞和数智助力某国有银行监管大数据平台
数据湖开发项目
什么是数据湖?
数据湖是一个集中式分布化存储系统,可容纳任意规模的结构化和非结构化数据。与专门为特定分析任务设计的数据仓库不同,数据湖保留数据的原始形式,直到需要进行分析时才对其进行处理,因此可以支持广泛的数据分析活动,包括机器学习、实时分析和大规模数据处理,以指导企业、机构等做出更好的决策。数据湖可以部署在云平台或本地数据中心,其灵活性和扩展性非常适合现代大数据需求。
●●●
PART.01
项目背景
近来年,随着全面推进数字化转型,业务数据量不断增长,大型金融机构数据管理需求强烈。某国有银行需要基于大数据平台,构建数据湖,实现监管报送数据统一管理,建立面向监管报送的监管统计关系模型和多维数据模型,满足监管业务人员的多场景应用分析需求,如银行机构全景视图、资金流向追踪、管理驾驶舱和模型工程等,以提高监管风险监测、风险管理能力。
瑞和数智依托在数据领域的深厚积累和丰富经验,助力该国有银行顺利完成了监管大数据平台数据湖开发项目。
PART.02
解决方案
统一规范,统一标准,汇集现有1104、EAST等数据,以及税务、地方金融监管等外部数据,构建监管大数据应用能力,提供图形化数据分析、可视化挖掘工具,实现数据挖掘更深入,风险展现更直观、更全面。
数据湖的建设工作包括:
信息调研
模型设计
数据接入
融合计算
业务支撑
PART.03
数据湖开发平台能力
提供高可靠性、高性能、可伸缩的分布式
存储系统及可扩展的大规模数据处理能力
采用Hadoop框架体系,在一定程度上可降低单位存算成本并支持海量结构化、半结构化及非结构化数据的统一承载。
提供丰富的数据计算分析引擎
具备对结构化、半结构化和非结构化数据进行多层次融合分析的能力,包含批处理、流式计算、交互式分析到机器学习等各类计算引擎。
具有完善的数据管理能力
可以管理各类数据相关的要素,包括数据源、数据格式、连接信息、数据schema、权限管理等。不仅能存储原始数据,还能够保存各类分析处理的中间结果,并完整的记录数据的分析处理过程,能帮助用户完整详细追溯任意一条数据的产生过程。
PART.04
项目价值
通过建设数据湖,统一管理数据来源及数据加工口径,提升了数据获取效率
实现了监管报送的数据可追溯性,从数据湖随时可以提取最原始的数据明细
建立了数据治理的平台基础,有效标准化管理数据输出接口
通过数据应用场景沉淀了面向业务的数据模型