建设运维数字化,亿联银行多云治理案例介绍

文摘   科技   2024-09-05 11:00   上海  


项 目 整 体 建 设 

为了将行内各类IT基础资源和第三方系统纳管整合,并承载行内业务需求,亿联银行建设多云治理平台,提供资源和流程的标准化能力,将现存的多个云环境、运维流程与系统打通,建设流程、资源和人员的相互协作并通过FinOps费用化所有资源,加强成本管控的同时大幅提升资源使用率。主要包括如下几大块内容:

1. 建立多套全新的私有云环境,涵盖了开发、测试和生产等多个领域,成功完成私有云平台的自主可控化转型。

2. 依托骞云平台,搭建多云治理平台,打通管理孤岛,实现不同数据孤岛之间的信息交流与共享。

3. 基于骞云平台,构建FinOps体系,有效降低成本并提升效率,实现对云资源的精细化管理。

经过本项目的建设,亿联银行多云治理平台的整体架构如下图所示:

自服务门户:提供业务用户全生命周期的自助服务功能,包括资源自助申请、资源变更自助申请、监控信息自助查看、自助续租或回收资源等。

服务管理:基于面向应用的自动化交付能力,通过应用蓝图建模、服务配置和服务发布向最终用户提供服务目录。

运营管理:提供FinOps能力,使运营人员能对云平台纳管的资源池进行统一的可视化的管理,及时掌握总体资源概览、各部门和项目已使用资源和可使用资源配额、资源申请回收趋势等。

运维管理:提供面向应用环境的端到端资源自动化部署、监控和运维变更。使业务用户和运维人员通过平台对IaaS、PaaS等资源实现多种运维场景的治理操作。

系统集成:提供可扩展的对接现有系统的能力,对接ITSM服务管理平台、堡垒机系统、漏洞扫描系统等,以多云治理平台为集成中心,连接并协调各种平台和系统之间的交互,促进无缝数据交换。

多 云 治 理 平 台 核 心 能 力

多云治理平台建设的整体设计以提高行内运维和运营效率、降低成本为目标,重点建设以下几个方面内容:多云统一纳管、标准化服务流程实现自服务、构建端到端多云治理运维和通过FinOps实现精细化运营。

一、多云统一纳管

目前多云治理平台已纳管现有行内各数据中心下的多套云平台,包括私有云、多套存储、生产测试容器云和网络平台,并对纳管的资源在平台内进行细分、配额、优先级管理。通过平台统一纳管云资源,解决了多数据中心/多云平台资源孤岛管理问题,避免在运维过程中登录到不同云平台操作,大大提高了运维人员的工作效率。

、简化和标准化流程,实现完全自服务

多云治理平台现已纳管多个云平台,构建了标准化的云中立服务目录,集中展示多种可用的云服务,涵盖基础计算、对象存储、网络、中间件、数据库、消息队列等,以及行内自主开发容器的服务目录。研发人员可以通过简单的界面进行自服务式资源申请、审批状态自助查询、可视化部署过程自助查看和资源自助续租或回收等,以满足不同的、快速迭代的资源需求,从而提高工作效率。

面向研发人员的自服务是一种高效且可管控的IT服务模式,多云治理平台设计了配额申请流程,实现对各研发团队的配额管理以及后续扩容管控,允许各研发团队在配额范围对资源的灵活申请和使用,让测试环境资源申请更加简单高效、简化审批;而在生产环境资源的管控更加严格,加入了更多的审批确认环节,以确保生产环境资源的安全可控。

三、打通管理孤岛,建设流程、资源和人员的相互协作

多云治理平台基于基础设施及代码(IaC)能力,与多个云平台进行集成,实现了端到端的资源的治理能力,帮助行内资源交付场景拓展到涉及多种资源、多个平台的完整自动化交付,包括且不仅限于:云主机、裸金属服务器、存储、负载均衡、软件等。同时与行内多个现有管理系统集成,包括ITSM、堡垒机、漏洞扫描平台、统一认证系统、CMDB系统、钉钉、短信等,实现跨多平台的协作能力,成功打破了管理孤岛,整合了混合异构资源,实现了面向运维、资源的全局资源治理的自动化体验,实现了流程、资源和人员的交互协作,大大提高了运维效率。

四、通过FinOps实现精细化运营

多云治理平台实现了费用化管理和精细化运营,通过可量化的费用结算,研发团队清晰了解并承担成本,从而更好地管控成本,提高资源利用率。通过建立透明的计价规则,将硬件成本、机房托管成本、科技运维中心人力成本、网络设备成本等按照规则分摊到计算、存储、网络服务的定价中,确保科技运维中心所有成本都能够明确标示。按照部门和应用系统两个维度进行成本分摊和运营分析,以便分析科技运维中心费用的具体用途、涉及的部门以及分布情况等。再者进行定期扫描主动发现空闲资源,结合业务系统实际情况进行资源回收。

通过FinOps精细化运营,促进了研发部门更加积极地参与到资源的选择和使用中,从而实现了资源的最优配置和成本的最大化利用。

平 台 先 进 性

多云治理平台通过对异构资源的统一纳管,良好地解决了割裂的多平台管理,避免了运维人员多平台操作的繁琐性,大大提高了运维人员的工作效率。将行内各类资源统一集中管理,对产品生命周期、计费、运营分析统一管理,从而降低所有产品的学习成本及运维成本。平台的先进性体现在如下方面:

运维统一:平台提供丰富的运维功能,实现异构资源的统一纳管、统一运维。

流程标准化:统一各种资源的申请、变更、销毁的流程,打通自动化和手工过程,形成亿联的标准化IT服务体系。

资源集中管理,提升资源使用率:集中管理现有计算、存储和网络资源,通过配额和费用,有效量化资源用量,并通过多种分析手段,提升资源使用率。

打通信息孤岛:加强各个IT管理系统间的信息交互,建设面向使用方的无摩擦的云服务体验;对接ITSM、堡垒机、CMDB等行内系统,打通管理孤岛,实现资源的信息同步。

操作自动化,减少人力成本:全部操作都由系统分析、选择并自动化执行,全过程无需人工,改变了传统的“柜台式”资源交付模式,极大地减少了重复性人工操作。

加速数字化:改变了IT的服务模式,加快需求响应速度,支撑业务数字化过程。与传统的IT基础资源管理和交付方式相比,多云治理平台的资源管理和交付周期显著缩短,实现了资源的快速上线,部署、扩展、维护的工作量都大幅减少。标准化的资源申请、审批和交付流程,极大地节约了手工操作的人力成本,降低因人工操作失误导致生产问题的概率,实现资源安全、高效、快捷交付,为亿联银行业务发展提供有力支撑。

平 台 的 价 值 收 益

亿联银行基于骞云平台建设的多云治理平台,构建了一个平台上的平台,将平台工程(Platform Engineering)核心思想落到实处。随着项目建设完成,亿联银行在以下几个方面获得了收益:
1、提高运维效率,加快服务响应速度
通过整合跨多个平台的流程自动化,资源交付周期由1到2天缩短到30分钟以内,并减少了运维人员80%的重复性操作,减少人为出错,提高了运维效率,降低了人力成本。

2、标准化服务申请流程,提高资源申请效率

跨多云平台统一管理云资源,制定和发布统一的标准化服务目录,业务用户可以从单一界面请求服务和资源,简化了服务申请流程,缩短了申请时间,提高了用户满意度和工作效率。

3、充分借助开源项目,实现云平台自主可控

搭建了全新的私有云环境,覆盖了开发、测试和生产等多个领域,成功完成了私有云平台的自主可控化转型,同时节省了大量成本。

4、降低集成复杂度,提升平台间的协同效率

通过多云治理平台作为集成中心,连接行内已有平台和服务,实现数据和流程的顺畅流动,促进生态系统内部各方的协同合作,提高工作效率,降低了集成的复杂性,提高了资源利用效率。

5、精细化运营,实现降本增效

通过FinOps,可以更加精准地了解和控制行内费用支出,将云资源的使用与实际业务需求匹配,实现成本与价值的平衡。

6、多样数据聚合分析,增强运营决策能力

通过将来自不同来源的数据聚合并呈现在统一的仪表板或界面中,提供了全面的运营视图,帮助运营人员更好地了解业务状况,可以更快速地发现问题并进行解决,减少了业务中断的风险。

多云治理平台遵循平台工程思想,构建了标准化服务目录,为亿联银行各部门提供网络、计算、存储、安全和监控的治理运维服务,且打通多个不同的工具和流程来管理资源,打通管理孤岛,实现数据的互通和共享,让资源创建和变更的流程变得更加协调和高效。同时,通过平台的低代码开发方式保证未来新资源能够持续接入,行内自主接入容器服务,实现标准服务向容器服务迭代,使得亿联银行能够更快速地引入新的技术和服务,推动业务创新,提升竞争力。
 平台实操指南|在骞云平台上通过SNMP对物理设备进行监控
 SmartCMP SaaS 2024 Update 4|更新至骞云平台8.0.1版本
● VMware Aria云管理套件不单独售卖了该怎么办?
 今日直播| 统一运维管理平台V8.0新版本功能特性讲解
 平台实操指南|VMware VM属性详情查看分析
 SmartCMP SaaS 2024 Update 3|更新至骞云平台8.0版本
 骞云统一运维管理平台V8.0正式发布
 降本增效,某新能源车企平台工程和FinOps案例介绍

骞云科技CloudChef
中国云原生管理领域领导者,建设数字化企业,释放云上生产力!
 最新文章