主机上云 | 核心系统下移实践及上云思考

学术   财经   2025-01-09 14:40   北京  

随着移动互联网、线上支付、电子商务的蓬勃发展,金融服务的渠道和场景更加丰富,传统IT架构已无法满足业务快速发展和创新需求。贵州省农村信用社联合社(以下简称省联社)是在省政府领导下,负责全省农村商业银行的指导、协调和管理,履行“服务、指导、协调、创新”职能的省级地方金融监管机构。基于提升系统扩展性、灵活性和可靠性,降低IT运维成本,实现基础设施资源统一管理与监控,提高资源利用率等目标,省联社规划开展了核心下移工程。


贵州省农村信用社联合社信息科技部

总经理  刘超



核心系统架构现状


随着业务的高速发展,新型业务产品和种类的增加,核心系统所承载的交易范围越来越多,系统规模越发庞大,处理压力日趋增大,原有的系统架构已经难以满足快速变化的市场及客户的多样化金融需求。


省联社原核心系统构建在基于IOE的传统集中式基础架构之上,采用纵向扩展的方式通过提升单机的物理资源来提升系统的处理能力,通过硬件设备和基础软件的集群机制保障系统的可靠性。但集中式基础架构本身缺乏灵活的扩展能力,随着金融业务的快速发展和交易量的激增,传统的集中式架构成为制约核心系统应用层扩展的瓶颈。同时,集中式架构硬件设备维护成本高,纵向的性能提升不足以支撑业务迅速增长。此外,随着金融业信息技术自主可控战略的推进,原厂商支持力度持续下降且存在服务中断风险。


为解决上述问题,需要对业务系统进行充分地组件化和服务化,构架“微服务”架构;通过平台工具的引入,提升开发、测试及运维的管理水平,加强统一管理。



核心系统下移设计


总体思路按照,技术改造为主驱动,辅以业务优化升级。完成核心系统全面改造,构建“小机下移+分布式服务+应用上云+分布式数据库+多中心多活”的核心系统新架构体系。按照改造过程中解决业务痛点及难点问题的原则,主要是从6个方面进行升级:将原集中式数据库升级为分布式数据库;实现核心系统下移;将核心系统应用小机集群改用云平台部署;将主备灾备模式升级为多中心多活模式;将核心系统表结构进行整体优化升级;将存储过程、触发器和视图等改用Java语言实现,摆脱对数据库的强依赖。


为匹配业务目标,完成核心应用从原有的封闭式集中架构下移到开放平台,整个过程提出以下5个技术目标:架构升级,将核心系统由集中式架构升级为分布式微服务架构,支持应用及数据库节点的横向扩展;实现全栈信创替代;实现双中心双活;完成数据落标,提升监管报表质量;完成应用全面上云。


在技术架构升级设计中,按照主体业务流程不变、业务功能不变、核心系统接口尽量不变(联机、批量)的原则,从而有效降低外围系统改造范围,为项目建设赢得时间。从集中式架构升级到分布式架构严格遵循微服务设计原则,在微服务划分过程中,主要遵循6个原则:保持数据独立;查询与交易分离;根据需求变更频度不同,进行微服务的划分,降低因发布变更影响高频交易;根据业务流程不同,拆分为不同的微服务;根据性能要求不同,将有性能极致要求的交易单独为一个微服务,通过简化相关调用链路来提升性能;将流程编排和业务逻辑分离。


根据以上原则,省联社将核心系统架构拆分为交易调度层、原子服务层、应用平台层和技术平台层。


交易调度层主要负责服务编排及调度;原子服务层负责业务逻辑的实现;应用平台层主要是将一些基础功能和公共功能提炼出来,避免重复开发,降低项目建设工作量;技术平台层主要负责分布式架构下相关基础能力的实现。


通过4层架构体系有效实现流程编排、业务逻辑和基础能力的解耦,让系统架构更加灵活。


在数据库的架构设计中,围绕业务目标,需要对数据库的架构设计制定5项设计原则:实现同城双活和快速切换,实现数据库RPO=0,RTO<60秒;确保数据一致性和可追溯性,充分考虑数据库事务保障能力和数据库闪回等数据溯源技术的应用;资源规划应具有合理性,确保数据库资源合理配置;架构设计应当兼顾核心系统联机交易和批处理性能;以数据库最佳实践架构和业务功能、特性作为参考,设计合适的分库数量。


在基础网络的架构设计中,通过SDN网络技术基于业务意图、云网一体的自动化,以及网络资源的弹性扩缩容和智能化运维等相关能力,为多地、多中心分布式应用多活提供基础支撑。通过构建硬件SDN+云平台云网协同、分层解耦、模块化设计的双中心弹性无阻塞高速传输网络,形成同城双活+异地容灾的弹性可扩展架构,为业务两地三中心容灾及稳定运行提供保障。


其中,云平台作为核心系统信创改造建设的基础运行环境,需要满足核心分布式架构对基础环境可扩展性、灵活性、可靠性、兼容性的要求。在云平台选型和方案设计中,省联社对标原有集中式架构的99.999%可靠性,以及监管对银行业金融机构容灾和业务连续性的要求,对云平台的建设提出了“五高”的要求。


高可靠:云平台除自身具备全冗余、高可靠设计外,还需要具备能够满足业务高可靠能力。


高可用:云平台支持两地三中心容灾、多地多活、全栈容灾能力。


高安全:云平台支持等保2.0三级、数据安全等能力。


高性能:云平台可以与底层硬件高效协同充分发挥服务器、存储和网络等硬件性能,为应用、组件、平台提供加速能力。


高可维:云平台具备硬件故障快速感知能力,具有应用视角全链路监控能力,与行内现有运维体系可以集成对接。


随着核心系统从原来的单中心服务、双中心主备的集中式架构到微服务化、双中心双活的分布式架构,不仅运维的对象数量和规模大幅增长,调用链更加复杂,为保障业务连续性,提升系统稳定性,省联社在整个运维架构设计上,将核心系统可观测体系拆解为业务运营层、应用性能层、组件服务层、操作系统层、硬件设备层和基础设施层的监控能力,对原有的监控工具进行升级改造,对指标数据进行完善扩充和分级分类,构建主动运维与智能运维的数据基础。


为有效保证核心系统改造工程的顺利推进,我们将以上设计分解为四个方面的工作:一是打造以核心系统为中心的立体可观测能力,实现核心系统运行状态的全面掌握和理解;二是持续统计分析各项可观测数据,主动对系统健康状况并进行反馈和优化跟踪;三是开展一体化智能运维平台的建设,对核心系统的可观测数据进行整合、场景建模和智能分析;四是组建专项团队,从建立产品知识体系及深入底层技术、源代码等方面,加强协作,不断开展测试验证,优化实践的方式,提升运维人员的技术实力。



核心系统上云的思考


从当前金融行业,尤其是区域法人银行业金融机构核心系统下移到云平台上的趋势和进展看,核心系统上云仍存在一些待突破的“点”。


首先,对于区域法人银行业金融机构而言,目前尚缺少城市商业银行或农村金融机构核心系统上云可落地的技术体系和方法论。虽然有大型银行已经实现自身的核心系统上云,但终究还是因为大型银行依托自身强大的科技实力和庞大的资金投入所致,区域法人银行业金融机构属实难以仿效。


其次是云平台及其底层硬件如何实现软硬联动,从而能够提供对标集中式机构体系99.999%的高可靠性,以保障业务稳定运行10年及以上的目标。


其三是核心系统上云后,将面对更广泛的分布式技术生态,如何在软件层面进行繁荣建设的同时,快速掌握不同汇编语言、技术栈的使用和维护,对各机构的技术人员提出了更高的要求。


其四是如何通过云平台自身故障检测和自愈能力的提升,降低各机构对底层基础设施运行维护的成本投入,使运维人员能够将更多精力投入到业务层面。


最后是云平台底层硬件驱动升级、硬件到期更换、云平台操作系统升级、云服务升级时,如何降低业务面的感知,做到业务无感。


综上所述,中小金融机构要实现主机上云,不仅需要借鉴同业的案例,同时还需要专业厂商量身定制的技术方案,全力保障关键核心技术自主可控。


(此文刊发于《金融电子化》2024年12月上半月刊)


滑动查看公告详情

新媒体中心

主任 / 邝源

编辑 / 姚亮宇  傅甜甜  张珺  邰思琪

金融电子化
面向金融界科技人员、业务人员,在金融信息化建设中,为领导决策提供参考,为科技人员和业务人员提供交流的园地以及了解科技应用的窗口,为读者提供金融信息化发展最前沿的各类知识和信息。
 最新文章