中小银行关键应用信创虚拟化平替路线高可用及容灾实践难点(同行交流共识)

科技   2024-11-14 07:35   海南  

在金融行业,尤其是中小型银行中,关键应用的信息化和创新(信创)是提升服务效率、保障交易安全、增强竞争力的重要手段。随着云计算技术的成熟与普及,虚拟化平台作为支撑这些关键应用的基础设施,其稳定性和高可用性变得至关重要。然而,中小银行在实施关键应用的信创虚拟化平替过程中面临着一系列挑战,包括技术选型、成本控制、系统兼容性、数据安全以及业务连续性等问题。

近日,社区组织同行深入探讨在中小银行进行关键应用虚拟化改造时,如何构建一个既能满足高可用性要求又能保证灾难恢复能力的信创虚拟化平台,以及平替中遇到的主要难题和解决方案,确保银行关键业务的稳定运行和数据的完整性。本文是此次探讨中的内容精华和形成的同行共识,供大家参考。

议题主持: 
姚雅飞(ID:yyf123) 威海银行 基础架构架构师
议题交流共识贡献者:
努力搬砖 某股份制银行 系统运维工程师
Fresh feel 北银金融科技有限责任公司 云平台运维管理岗
zhangpan31 富滇银行 技术经理
chenmingfu 西部某城商银行 基础架构组长


1、信创虚拟化平替路线迁移的难易程度、成本和迁移稳定性如何?


努力搬砖 某股份制银行 系统运维工程师:

信创虚拟化经过几年的沉淀,信创虚拟化技术相对成熟,目前很多公司都有提供相对稳定的迁移工具,方案比较成熟,另外,这些迁移工具的收费通常是按照迁移虚拟机的数量来计算的。这种成熟的技术和工具可以帮助企业在进行信创虚拟化平替时降低迁移的难度和成本,同时保证迁移的稳定性。迁移上不同的企业有不同的业务需求和技术架构,因此在进行迁移时需要根据实际情况进行评估和规划。

Fresh feel 北银金融科技有限责任公司 云平台运维管理岗:

1)难易程度:难易程度还是看需求场景。迁移也区分直接迁移还是信创改造。信创改造的话带着操作系统和中间件一起改本质不属于迁移范畴了。而单纯迁移的话,需要考虑的因素比较多,比如迁移数据的大小、系统可接受的停机窗口、迁移工具的性能和稳定性、带宽大小等,难度主要体现在需要调研和思考的比较多,并搭配做足测试工作。

2)成本:主要看目的信创虚拟化的选型,不同厂商产品的建设成本、维护成本都不太一样。总的来说,相对VMware大多都会或多或少的增加吧。

3)迁移稳定性:迁移稳定性和迁移工具以及目的虚拟化平台的关系较大,现在国产虚拟化平台的基础功能基本都是具备的,稳定性这块基本都没什么问题,差距主要集中在性能和体验上,就需要POC感受下了。

yyf123 威海市商业银行 基础架构架构师:

本次所说的虚拟化主要指x86的虚拟化,在非信创的环境下,主流的虚拟化一般以VMware为主,一些基于KVM的国产虚拟化应用的较少,而信创环境下的虚拟化还是主要以基于KVM的为主(基于其他开源的也适用),版本上有ARM版和X86版。在非信创到信创的平替过程中,难度无非就是虚机的兼容问题、国产虚拟化的功能、稳定性问题。

虚机的兼容问题,只要是虚拟化底层的技术体系不一致,虚拟机基本无法通过直接识别后进行迁移,直接迁移的方式也基本就一种——借助第三方的迁移软件进行迁移,方法基本和大家首次从物理机迁到虚拟化时的方法类似。但是实际操作时,大家在信创过程中,都是要求应用先进行重构(使用国产系统软件、操作系统),然后部署在信创虚拟化上运行,基本都是重新安装,不会进行迁移。成本上综合来看差不多,授权上国产虚拟拟化授权比VMware便宜,但可虚拟的能力上比不过VMware,再加上国产的硬件设备价格高于非信创的价格,性能上低于非信创的设备,迁移到国产化后整体成本可能会上升,虚拟化软件购买成本可能稍低。稳定性上,国产的大厂如浪潮、华为等,稳定性基本没有问题,功能上几乎能够涵盖住VMware的常用功能。

2、在确保高可用和容灾的同时,如何有效控制信创虚拟化平替的整体成本?对比平替前能否降本增效?


努力搬砖 某股份制银行 系统运维工程师:

个人认为如果是企业的关键业务做平替,不能单纯的只考虑高可用和容灾,还得考虑整体的性能,如果单纯的为了节省成本忽略了性能,后期影响到业务的话,那可能得不偿失。所以如果要控制成本建议主要是在资源容量上做好管控,不要一次性按一年或者三年等这样的业务增长量去评估资源需求,而是前期用到多少申请多少,后续资源使用不够了再进行扩容的方式,避免资源浪费也是一种节省成本。做信创平替目前是做不到降本增效,因为信创的设备要比传统的x86设备性价比低,做信创替换的根本主要是为了国产化,防止技术上被卡脖子。

yyf123 威海市商业银行 基础架构架构师:

VMware平替到的信创虚拟化,主要驱动力就是国产化的要求,在平替中硬件平台必须更换,目前信创虚拟化主要使用ARM和X86两种CPU架构,基于控制成本在CPU架构选型初期可以以X86入手,逐步引入ARM架构(根据自身的规模)。原有的服务器撤下后,可以搭建对应用影响小的环境,例如数据库服务器(作为多套测试环境中的一套)。而存储和网络设备作为所有应用的基础承载,不能像服务器那样在应用系统减少后可以立刻撤出,VMware平替到的信创虚拟化主要工作量在应用,平替周期较长,随着平替完成基本自然淘汰。信创虚拟化的功能不像VMware那样完善,是在逐渐追赶VMware,价格上也没有优势,平替后不能降本增效,主要目的就是完成自主可控。

Fresh feel 北银金融科技有限责任公司 云平台运维管理岗:

1)信创虚拟化选型:在选型阶段平衡好建设成本和维护成本的关系,这意味着在选择虚拟化平台和技术时,不仅要考虑到初始的采购和部署成本,还要考虑到长期的维护、升级和运营成本。尽量在保证功能性能都满足要求的同时尽量压降成本。

2)硬件利旧:尽可能的针对现网环境通过评估设备价值有利旧价值的机器进行利旧处理。

3)资源池改造:比如之前有针对网络区域等进行物理隔离的场景,结合现有需求进行重新考量。尽可能地减少资源池,做大资源池。提升资源使用率,进而降低成本。

3、在虚拟化高可用和容灾基础上,同城双中心的虚拟化如何实现成一朵云,降低双中心运营成本?


Fresh feel 北银金融科技有限责任公司 云平台运维管理岗:

一般来说想同时纳管同城双中心的虚拟化成为一朵云有两种方式:

1)一个云管下分别纳管两个中心的虚拟化,比如两个中心可以分别部署云管,通过域名切换实现统一管理。

2)直接购买整体云平台,做双中心架构,这样可以实现更为紧密的资源整合和管理。如果只是想统一入口,从而降低双中心运营成本的话,上面的两种方式都可以。如果想进一步降低运营成本,还需要配合流程建设、数据建设、自动化工具、成本分析等手段及平台进行配合,从而实现更高效的双中心云环境管理。

zhangpan31 富滇银行 技术经理:

到了云平台层面就不止是虚拟化产品了,小一点云产品应包含虚拟化计算资源、各类存储资源、云SDN网络、安全产品以及必要的各类型数据库。至针对虚拟机产品的话,要实现同城双中心容灾或双活。建议增加跨中心负载均衡产品或使用全局DNS域名方式来暴露服务,平时基于策略实现双中心的业务负载容灾或双活。如果涉及到持久化的数据通过文件存储、对象存储或数据库来实现跨中心的共享访问和容灾切换。如果跨中心的虚拟化平台是主备模式,在主中心整体故障或部分产品故障需切换到备中心需做应急切换处理的,那规划时需结合网络同步评估主备中心的数据同步(块存储or文件存储)、备中心虚拟机的快速拉起、网络IP等配置、日常应用部署过程中的版本一致性等因素。基于云的体系一般有专业的运维管理平台,负责日常维护和主备切换,以及自身管理平台的容灾保护。

若考虑降低运营成本,那需要总体评估中心的定位、双中心资源的配比、业务连续性的要求、硬件成本等,从设计角度上单中心需承载满载的全部业务流量处理,那备中心在应急场景下使用,可以适当缩减资源仅保障关键业务、开门业务、重要系统等,数据类仅同步业务数据,减少平台管理数据的保存周期等措施。

yyf123 威海市商业银行 基础架构架构师:

在虚拟化高可用和容灾的基础上,实现同城双中心的虚拟化成为一朵云,关键在于如何统一管理这两个中心。无论是使用虚拟化自带的管理平台还是云平台,都可以实现这一目标。

以常见的部署方式为例,即在同城双中心各自部署一套独立的虚拟化集群:在规划时,将物理服务器上的网卡(网口)分类使用,建议使用两块网卡(两个网口),作为管理网使用,其他网口做业务网使用,以增加管理网防火墙的安全性(通过防火墙保护)和独立性(使用单独的管理交换机)。将物理服务器的IPMI口、存储的管理口统一接入管理网络,这样可以远程对物理服务器进行重启、存储划分等控制操作。网络策略配置上允许管理节点(或云管平台)对双中心的管理网络进行访问。这样,无论哪个中心的设备出现问题,都可以通过另一个中心进行管理和恢复。对管理端来说,只要被管端的网络可以访问,就可以直接添加被管对象。这样,我们就可以在一个平台上统一管理和监控两个中心的运行状态,大大提高了管理效率。

4、信创云底座选型的重要指标有哪些?


Fresh feel 北银金融科技有限责任公司 云平台运维管理岗:

按个人经验,基本功能大多都是具备的,我大概分了两个层面您可以参考,其一是基础指标都是一些比较客观硬性的,在这个基础之上要做好选型工作还需要综合考量一些差异化的指标,在这些方面上才是真正能拉开差距的地方,比重的话还是需要自行根据需求考量。

基础指标:

1)性能:这个展开说比较多,还是看自己的关注点,建议着重关注虚拟机磁盘的读写性能、虚拟机迁移时间(看实际需求测试下高配置)和虚拟机创建时间。

2)稳定性:建议关注高并发、高利用率下的冷、热迁移以及HA。

3)可靠性:按照不同类型的服务器进行一些宕机、拔盘测试进行验证。

4)兼容性:和现网硬件或者是和需求软硬件的兼容性。

差异化指标:

1)开放性:有些厂商的产品绑定还是比较深的,就看能接受多少,比如云(计算)和存储的绑定、软件和硬件的绑定,甚至有的还有上层软件的绑定。

2)自动化程度:例如扩容、升级的自动化程度,报表等功能对需求的覆盖率、页面对底层批量操作等。

3)监控告警:一方面是监控的覆盖率以及阈值调整的便捷度;再有就是告警的收敛,是不是能做到告警压缩,以及告警分级是不是合理以及可调整。最后是接口的完善程度。

4)用户体验:比如UI设计简洁大方,功能模块清晰,监控的覆盖面和可编辑,告警的收敛。

5)成本:一方面是建设成本,主要就是软硬件;另一方面是运维管理的成本,一个是每年的维保费用和人天,再有就是维护平台的人力费用。如果有历史包袱的话,还不可避免的需要考虑到和现网环境以及各个系统的兼容性等因素。

yyf123 威海市商业银行 基础架构架构师:

1)在建设信创云底座的时候,选型的重要指标有哪些?首先,企业要明确建设信创云的目标、未来的发展方向和自身的技术实力。其次,企业要明确建设信创云的投入,产品档次不同价格差异很大、技术栈差异也较大。目前,市场常见的IT基础架构转型路线,主要有基于公有云技术栈的专属云、存算分离的传统私有云架构、超融合信创云基础设施。参照现有的运行架构,可以推荐选型的基础指标重要组件的性能指标、基础架构高可用、容灾能力、扩展能力、公司实力、安全指标。

2)使用哪些指标在单一云和多云+CMP两者方式中选择,是否支持混合云管理能力。

5、如何实现传统虚拟化平台往信创虚拟化平台的平稳迁移?


chenmingfu 西部某城商银行 基础架构组长:

信创一般都是全栈替换演进,比如CPU芯片替换为ARM等不同架构,操作系统替换为银河麒麟,中间件替换为tongweb等等。这种情况就不是简单的虚拟化平台的虚拟机迁移,涉及上层应用适配改造,需要新建设好信创云平台,然后重新集成部署信创环境的虚拟机操作系统及中间件,代码重新编译适配,还需要在新的信创环境中对整个系统进行集成测试,确保所有组件都能够协同工作,满足业务需求。最后,当一切准备就绪后,可以开始逐步将业务迁移到新的信创平台上,并最终实现全面投产上线。

努力搬砖 某股份制银行 系统运维工程师:

迁移是一件比较大的工程,当你准备开始迁移的时候说明已经选定好了信创虚拟化平台的厂商。

首先,可以咨询厂商是否提供适合他们平台的迁移工具,正常都会有,如果没有那就找一个目前比较主流的迁移工具。

然后,需要制定一个合理的迁移方案及规划,包括(1)迁移顺序:非重要系统先迁,重要系统后迁;2时间节点:选择没有业务的时间点迁移,根据容量大小评估好迁移时长,合理划分迁移时间段,避免资源抢占;3资源容量:规划好计算资源、存储资源及网络资源落位,确保资源充足(特别是多网卡的设备,确保vlan正确);4备份验证:重要系统迁移前是否需要做好数据备份,所有系统迁移完后让业务做好验证,确保业务运行正常,迁移过程中或迁移完验证业务有问题即使回退。

最后,每天迁移完做好记录并总结,如有发现问题及时解决,确保后续迁移方案正常可行。

Fresh feel 北银金融科技有限责任公司 云平台运维管理岗:

1)资源替换路线:目的信创虚拟化平台需要经过充分验证,包含其配套的迁移工具的测试工作。选型至关重要。

2)业务系统调研:在奠定工具选型的基础之上,想要达到平稳的迁移效果,就需要对业务系统的资源有比较深的了解,哪些能迁哪些好迁,风险点在哪,势必做到心里有数。

3)明确迁移原则:明确迁移原则,比如哪些支持迁移哪些不支持迁移、是否支持迁移后IP不变等。

4)整体迁移方案:时间规划、批次规划、网络割接等需要统筹考虑。

同行交流共识


信创虚拟化建设是信创建设中的重要环节,目前国内产品在稳定性、安全性、性能方面基本能够满足关键业务系统的运行要求,迁移方案完备成熟。在成本上,和国外的同类产品基本接近。实际落地的过程中,结合企业自身的管理要求,采用云平台底座,建设信创的IaaS云,完成对信创基础硬件的统一管理、资源一键化提供,屏蔽了信创产品硬件操作的复杂度提高了资源提供效率。

难点总结:

综上所述,信创虚拟化产品成熟,性能能够满足要求,综合考虑业务连续性、虚拟机规模、迁移过程中一些不可控的因素,迁移工作是整个虚拟化平替中的难点工作,要充分做好迁移工作的评估,保证虚拟化平台的平稳过渡。


欢迎点击文末阅读原文到社区阅读和讨论交流,发表您的看法

觉得本文有用,请转发或点击在看,让更多同行看到


 资料/文章推荐:


欢迎关注社区以下  “虚拟化”技术主题 ,将会不断更新优质资料、文章。地址:http://www.talkwithtrend.com/Topic/23

下载 twt 社区客户端 APP


长按识别二维码即可下载

或到应用商店搜索“twt”


长按二维码关注公众号

*本公众号所发布内容仅代表作者观点,不代表社区立场

twt企业IT社区
talkwithtrend.com社区(即twt社区)官方公众号,持续发布优秀社区原创内容。内容深度服务企业内各方向的架构师、运维主管、开发和运维工程师等IT专业岗位人群,让您时刻和国内企业IT同行保持信息同步。
 最新文章