文 / 本刊记者 马俊
华为主机上云军团CEO、
混合云总裁尚海峰
Q
记者:主机是保障金融核心业务稳定运行的重要基础架构,也被称作核心中的核心,为什么一定要上云?
尚海峰:在过去的半个世纪,主机被广泛应用在金融、电信、能源等各行业最核心的系统里,它的最大特点是RAS,即极致的可靠性、可用性和可维护性,因此可以说是核心业务的不二之选。但随着越来越多新兴金融业态的出现,对资源的弹性供给、应用的敏捷迭代和技术的开放性提出更高要求,在这些方面传统的主机架构逐渐捉襟见肘,难以跟上金融创新的步伐。
将主机核心系统下移到开放平台已经成为业界共识。即基于通用硬件,结合分布式数据库、分布式中间件打造现代化新核心。其实早在2014年开始,国内一些大型银行就已经开始尝试探索主机核心系统的现代化改造,并且逐步锁定云原生架构作为演进方向。实践证明,基于云原生技术构建的新核心能够更灵活、敏捷地响应业务变化,主机上云不仅可行,并且是一个更优的选择。
但核心系统整体向云化架构升级演进挑战巨大,涉及硬件、软件、安全、运维、调优和工具等多方因素,是一个软硬协同、端到端的系统工程和世界级的难题。
Q
记者:您提到了金融主机上云是一个世界级难题,具体难在哪?华为在这个领域有什么战略举措?
尚海峰:这个难题简单一点说,就是“既要、又要、还要”。金融机构希望主机上云后能够保持原有主机的性能、可靠性和稳定性,又要兼顾云的扩展性和灵活性,还要易于运维、降低维护难度。举一个简单的比喻,传统主机核心系统就如同混凝土一体浇筑的桥墩,非常结实。主机上云现在要做的是用一块块砖头垒成一个同样稳固的桥墩,砖头是各种通用硬件设备,那么混凝土就是云软件,涉及操作系统、分布式数据库、中间件等,只有软硬充分结合,才能让桥墩足够稳固。
华为致力于解难题、做难事,正因为主机上云很难,华为软硬协同的技术优势才能充分发挥。你可以看到,今年我们成立了主机上云军团,就是希望通过成立这个组织,集结计算、存储、网络、云和中央研究院最核心的研发资源开展系统性创新,以软硬协同挑战主机上云这一世界级难题。一方面,持续突破根技术,构建起从芯片、硬件到云平台、数据库、中间件、负载均衡和应用使能的全栈技术体系,保障核心技术供应的连续性;另一方面,基于丰富的理论和实践,以业务视角构建从基础设施、实施工艺到运维体系的可信系统工程,最终打造敏捷、韧性、可信的开放新核心。
不同的企业所处的阶段不一样,演进的路线也不尽相同。因此我们面向核心平迁、核心组件替换和核心重构三大上云路线,沉淀基础设施现代化、数据现代化、应用现代化和运维现代化的4个场景方案,实现核心的积木式灵活演进。
我们希望通过根技术创新和经验沉淀,为开放架构的核心系统打造一个可信的新标准,这是我们不变的使命与担当。
Q
记者:在主机上云这个领域华为有哪些核心的技术突破,能给核心系统带来哪些不一样的变化?华为为什么有底气挑战这个世界级的难题?
尚海峰:云化的分布式架构能满足弹性、敏捷的诉求,但客观地说,还无法完全达到主机的可用性,还需要协同硬件的能力才可能实现,这也是为什么我们反复强调主机上云是一个端到端的系统工程。我们基于完善的硬件产品和华为云构筑云底座,软硬结合突破一系列核心技术,满足云上99.999%的可用性目标,为金融机构提供稳固的技术底座。我们总结成三个词:高可用、易运维、更敏捷。
一是在高可用方面。基于分布式云底座构建了秒级感知硬件故障的能力,2秒内发现硬件故障;基于弹性负载均衡、金融级调度和事务处理等分布式中间件,支持业务单元化部署和多地多活容灾;结合GaussDB分布式数据库故障6s内无感切换,构筑云上5个9的金融级高可用。
二是在易运维方面。方案以1分钟发现、5分钟定界、10分钟恢复为目标,打通软硬件的壁垒,从应用、云服务、云平台到硬件全链路秒级发现故障和分析影响,实现全链路可观测;同时建立数据链、交易链、部署链故障快速智能定界能力,让大规模集群运维更加高效;此外,基于混沌工程挖掘未知风险,识别系统薄弱环节,持续提升系统韧性。
三是在更敏捷方面。相较于传统集中式架构,主机上云能够实现资源的动态管理和弹性调度,配合华为云软件开发生产线CodeArts,大幅提升应用开发效率,让业务更敏捷。特别是在升级技术,有客户开玩笑说过去是“两年升一次,一次升两年”,为解决这一难题,华为首创操作系统原地无感升级技术,升级过程无需迁移虚拟机,支持批量并行升级,千级宿主机节点升级时间从21天缩短到5个小时内,大幅提升平台演进效率。
我们希望通过这些核心技术的创新,将核心系统韧性推向新高度,为世界提供一个更优的选择。
Q
记者:“十四五”即将进入收官之年,面向主机上云或是金融核心现代化的下一个五年,华为还有哪些经验和建议?
尚海峰:人们常说“路虽远,行则将至”。主机上云这条路注定很难,但我们早已出发,并且取得了初步的成果。从当前的形势和长远发展看,这已经是金融行业的一个伟大且没有退路的选择。结合实践,我们建议金融机构在下一阶段稳步推进主机上云时,应重点关注四个方面。
一是选择合适的技术架构和路线。核心系统从传统主机集中式架构走向开放分布式架构,已经成为必然趋势。这个过程中,金融机构也需要结合自身发展现状和整体战略,选择适合自身的技术架构和路线。业务的快速发展需要选择有技术前瞻性并兼顾稳定性和安全性的方案,能够支持弹性扩展,以及跨地域容灾和多活等能力。同时,架构本身需要能够分层次解耦建设,并逐步演进和叠加,尤其是选择同一体系内相对统一的技术路线,可以一定程度降低项目复杂度,更容易实现产品组合之间的性能调优、问题处置。
二是合理评估风险。主机系统的改造升级是一项复杂的工程,涉及硬件迁移、数据迁移、服务可用性等多个方面。需要从系统的角度出发,综合评估单点风险和整体风险,制定详细的风险管理计划,确保全流程的数据安全和服务的连续性。
三是持续优化和迭代。主机改造升级不是一蹴而就的,需要分阶段按照既定计划逐步推进,更需要进行不断地优化和迭代。金融机构应充分吸纳业界已有的成熟实践经验及方法论,并且结合各类优化工具,建立有效的知识库和经验积累机制。
四是选择具备端到端落地实践能力的合作伙伴,确保从理念、方法论、设计规划、平台架构以及标准规范方面都能够进行战略性长期投入和总体把控,最好选择有丰富实践经验、产品能力和服务能力成熟、能够长期共同发展的合作伙伴。
华为希望在这条路上与更多的客户、伙伴携手,走别人未走过的道路,看更美丽的风景。
(此文刊发于《金融电子化》2024年12月上半月刊)
推荐阅读(点击图片查看精彩内容)
新媒体中心
主任 / 邝源
编辑 / 姚亮宇 傅甜甜 张珺 邰思琪