文 / 华夏银行首席信息官 吴永飞
华夏银行信息科技部副总经理 王彦博
华夏银行信息科技部 魏文术 李士光 李娜
华夏银行首席信息官 吴永飞
项目背景
2023年2月,中共中央、国务院印发《数字中国建设整体布局规划》,标志着数字中国建设进入新的阶段,数字经济发展迎来新的高潮。商业银行应发挥数据和科技双要素优势,以整体规划部署为指导,打造新型数字生产力,变革数字生产关系,推进数据要素化建设,重塑商业银行数字化经营模式,开创银行数字化转型新局面。随着银行数字化转型进入关键阶段,对新一代数据体系的建设已经进入加速探索时期,各商业银行纷纷拥抱“数据中台”架构,推进从传统的数据仓库到数据中台体系建设,以适应数字化经营的发展要求。
华夏银行作为一家全国性股份制商业银行,坚持“数字华夏、智慧金融”的数科转型目标,一以贯之地坚持数字化发展方向,加速数据、科技、组织与人才四大数字化能力建设,推进“业技融合”与“技管融合”,积极探索数据价值敏捷交付体系新模式,走出一条具有华夏银行特色的数据要素建设之路。面对数据体系发展理念的深化,华夏银行始终坚持以“数据要素化”为核心,持续推进硬件虚拟化、软件云上化、算法模型化等数字化新基建,同时积极运用数字技术改变生产组织方式和方法,探索与数字生产力相适应的数字生产关系,形成具有华夏银行特色的基于湖仓一体的多模态数据价值敏捷交付体系。
整体平台功能架构
基于湖仓一体的多模态数据价值敏捷交付体系建设项目不仅是系统开发性项目,而且是一个跨越数据采集、加工、存储、开放、流通、应用,同时又保障全流程数据安全的业务数字化闭环价值交付体系,构建了包括数据采集加工体系、数据开放体系和研发治理体系在内的三大体系九大功能。平台功能架构概示如图1所示。
图1 基于湖仓一体的
多模态数据价值敏捷交付体系功能架构
数据加工体系,是以湖仓一体为基础的数据采集加工体系,持续提升数据储算、分析能力,包括数据交换、数据仓库、数据湖、数据科学和AI平台、虚拟数据湖五大功能。通过数据交换,实现全域(内部数据和外部数据)、全量(结构化数据和非结构化数据)、全时(实时数据和批量数据)的数据采集、流转;通过数据仓库、数据湖、数据科学和AI平台实现海量数据存储、计算以及数据挖掘分析等能力;通过虚拟数据湖实现跨异构数据源的访问和检索,提升数据开放需求响应能力,赋能数据流通和应用。
数据开放体系,是以多模态为特征的数据开放体系,实现数据访问加速,促进数据开放流通、提升用户体验。针对不同业务场景,构建标签、图谱、多维查询、实时计算等专题引擎,通过数据开放,以API、消息、批量、JDBC等方式,提供多模态数据服务,实现访问查询加速,满足多场景需求。
研发治理体系,是以一体化研发和数据治理为特征,实现数据研发和治理的统筹管理,包括数据研发、数据治理和数据管控三大功能。通过数据研发平台,提供研发过程的自动化、低代码可视化等一体化研发功能。通过数据资产管理及数据管控实现数据标准、数据质量、元数据、数据生命周期管理等基础数据治理和数据资产目录、数据资产标签、数据资产全景视图等高阶数据资产管理,助力实现资产开放。
三大体系相互协作,促进数据产业化发展和数据价值敏捷交付,提升数据生产力,推动“业技融合”“技管融合”,赋能数据生产关系变革。
项目的技术和应用创新
基于湖仓一体的多模态数据价值敏捷交付体系构建了企业级数据基础设施以及数据服务、数据开放及数据保障体系,其创新点和先进性主要体现于:一是建设完全自主可控的软硬件平台;二是实现创新的大数据新技术应用;三是形成统一、加速的数据流转共享机制,以及数据资产要素化和变革数据资产化的应用模式。
1.建设全栈自主可控大数据云平台,探索行业实施路线。数据底座应用全栈信创MPP数据库、大数据技术生态、任务调度平台等大数据开发与应用技术,为国家战略的落地提供了行业成功案例,为基于自主可控技术进行数据新基建探索了一条可行可借鉴的实施路线。平台使用ARM架构服务器、DWS数据库与MRS大数据平台、银河麒麟与欧拉操作系统、MOIA调度平台、数据虚拟化等国内软硬件产品与技术,构建了基于云原生的全栈数据基础平台与应用开放平台,实现了全行数据资产与数据应用的云上管理。
2.集约大数据新技术的应用,提升数据开发能力。统一了全行数据技术路线,降低了数据架构复杂性,构建了完整的数据技术生态,探索积累了信创云原生数据平台在企业级数据领域应用的行业实践经验。通过采用全栈自主可控的技术体系(如图2所示),实现了对平台的自主掌控能力;构建了实时数据计算平台,实现了对全时(批量+实时)数据的储算能力,支撑了银行客户营销、反欺诈等应用场景;构建了虚拟数据湖平台,实现了对湖仓一体的数据底座中所有异构数据库对象的统一访问,提高了数据探查和数据实验的效率;构建了多类数据访问的加速引擎,提升了数据访问效率和应用体验;构建了多模态的数据开放能力,提升了用户数据自主服务体验。
图2 虚拟数据湖技术提升数据探索效率
3.加速数据流转和共享,促进数据资产要素化。在项目实践中,构建了以“数据对象”为粒度的建模体系。数据对象是数据分析和数据管理的最小单元,通过这种建模方式,便于最终用户理解和使用,降低了管理成本。在数据对象的基础上建立领域认责机制,即每个对象属于且仅属于一个数据领域,实现数据单点加工,并考虑数据安全的分类分级,最终实现数据资产的可控可计量,加速数据流转和共享。
4.实现跨数据领域的公共数据资产沉淀,变革数据资产化模式。在传统模式下,一般通过建立独立“公共汇总层”来实现公共数据资产沉淀,这样往往会导致一些问题:一是“滞后性”,公共数据资产往往是对现有需求的共性需求的提炼,存在一定的滞后性,当公共资产建成后,由于涉及对现有的应用改造问题,导致公共数据资产存在“不愿意用”的问题;二是“闭门造车”,为了避免滞后性,有时会按照某种方法,主动提前加工公共数据资产,由于缺乏真实的场景需求,导致公共数据资产“不好用”“不敢用”的情况。在数据价值敏捷交付体系建设的实践中,每个数据对象属于且仅属于某个数据领域,数据资产包括公共数据资产在数据对象中自我迭代和演进,对于跨数据领域的数据访问,通过在公共资产层建立视图的方式来实现。这种“授权使用、视图开放”的方式变革了传统的公共数据资产的加工模式,提升了数据资产的加工敏捷性、准确性、一致性(如图3所示)。
图3 “授权使用,视图开放”变革数据资产化模式
项目成效
湖仓一体的多模态数据价值敏捷交付体系在行业内的应用,显著提升了研发投入效率、增强了基础算力,并有效防范了金融风险的发生。首先,基础数据的算力性能实现了数十倍的飞跃,通过在数据战略、数据架构、数据标准、数据安全、数据治理、数据应用、数据生命周期管理等方面的持续积累和提升,华夏银行通过了中国电子信息行业联合会数据能力成熟度DCMM4级认证。其次,实时数据处理场景的效能得到了充分发挥,特别是在客户交易反欺诈监控和风险防控方面,实现了对涉诈资金交易行为的即时阻断。最后,在新技术的应用上,产业数字金融部门以及多家分行的区块链和隐私计算项目已成功实施,全面推动了金融科技在业务场景创新与应用中的赋能作用。
结语
华夏银行构建的湖仓一体多模态数据价值敏捷交付体系,不仅建立了满足自身需要的技术生态体系,还确立了适应发展的数据要素模式。它促进了数据和技术这两大生产力要素的深度融合,成为推动数字华夏业务创新的核心引擎。通过这一举措,华夏银行全面提升了数据运用的效率和效果,构建了坚实的数据支撑基础,具备了较为完整的数据技术服务能力。同时,华夏银行也期望与业界先进同行进一步携手合作,共同探索一条适应我国金融行业自主创新的数据发展之路。
华夏银行信息科技部王鹏、贾蒴、周凌波、陈海芳,以及龙盈智达(北京)科技有限公司张军、程昭星、杨璇对本文亦有贡献
(此文刊发于《金融电子化》2024年10月上半月刊)
推荐阅读(点击图片查看精彩内容)
新媒体中心
主任 / 邝源
编辑 / 姚亮宇 傅甜甜 张珺 邰思琪