在当今数字化和AI时代,云计算已成为企业加速创新的关键因素,而云资源的开支也成为了整个IT开支中的核心成本。在私有云和公有云的规模日益扩大的同时,大量企业在如何能更有效的使用云资源,都会面临着如下几个核心问题:
传统的资源规划方式导致资源过度需求:在新业务上云过程中,云资源的申请往往会出现过量、超规格等情况,缺乏统一的规范和有效的管控手段
资源运行数据无可视化能力:无法统一、清晰的掌握各部门、各项目、各云产品的资源使用状况,使得云资源管理者往往陷入盲人摸象的境地
- 闲置资源缺少回收机制:系统长期低水位运行、大量已使用结束的资源未被回收、错误的使用方式更容易导致资源被浪费,平台管理方缺乏可衡量的手段和优化思路,无法做出积极有效的决策,资源被持续浪费
业务单位无成本意识,成本管理缺少数据支持:IT部门缺少对各业务团队资源用量的有效跟踪,无法实现对资源的规划、用量进行有效管理,这也导致业务使用方无云成本的意识,也没有控制成本的压力
案 例 背 景
一、资源浪费和闲置问题严重
缓慢的资源申请和开通流程导致资源不能按需使用,“提前申请,结束后未及时回收资源”的现象非常普遍。使用骞云平台之前,资源申请需用户根据基础设施管理员提供的excel填写内容(由于每个云产品的参数、场景都不一样),中间会需要申请者和管理员进行多次沟通,最终确认后再通过邮件提交申请,然后通过MSP的人工操作开通,完成初始化和配置等一系列操作后,方可提供给用户部门使用。由于整个申请过程高度依赖人工、沟通成本高、周期长、导致业务部门会提前几周就发起资源申请的流程,而用完后的资源回收也需要漫长的流程,进而造成资源在整个过程中浪费显著
非工作时间,开发测试资源被持续收费。经过对以往资源使用情况的统计和分析,发现在工作日的下班后、节假日期间,都存在大量的云资源仍在运行状态,企业为这些不必要的云资源仍在持续付费中
资源规格的使用不合理,资源往往被就高申请,这导致了资源使用率普遍较低,性价比差。经过调研和分析,发现其中很大一部分原因也是因为当下的资源申请、变更过程困难,流程太重,用户部门为了方便其申请,往往倾向在资源申请中都往高配提出申请
二、缺乏有效的费用数据统计和预算机制:公有云控制台只能提供简单的账单和标签级别的分账统计,而该企业客户的大量云资源分布在两朵云的多个云账户下,这导致了用户部门缺乏从业务视角对云资源的预算申请、配额控制、实时费用等多维度的决策数据支撑,进而导致云资源的使用方对费用成本没有感知
三、资源的安全配置不合规:由于企业的云资源数量众多,配置复杂,因此还存在部分资源没有关闭外网访问等不安全现象
解 决 方 案
为了解决这些挑战,这家企业客户寻求了骞云科技的帮助,以改善其FinOps的效率,减少云计算成本。骞云科技根据其痛点和现状,经过细致的分析、研讨后,有针对性地为其提供了多层次解决方案
自服务让资源随用随取,减少流程中的资源闲置和浪费,减少规格就高申请。骞云平台的自服务能力,使得资源通过自助申请并自动完成开通,极大的减少了流程等待的时间,真正实现了云资源面向业务使用方的按需实时获取。现在用户部门可以根据实际需要快速获取所需资源,不再需要等待繁复的审批流程。资源使用结束后,系统也实现了资源的自助销毁,快速回收闲置资源
数百种资源优化策略,主动发现闲置、低效资源:为了减少资源浪费,骞云科技的FinOps平台应用了多种资源的优化策略。除了IaaS资源,企业还大量使用了RDS数据库服务和中间件服务。这些服务拥有不同的优化策略。骞云和客户根据实际场景梳理出数十条优化策略(包括云主机低负载、未挂载的公网IP、未挂载的磁盘、无连接数的数据库资源等),策略涵盖了阿里云、Azure上的虚拟机、数据库、容器服务和中间件服务,帮助企业管理和优化了云资源,极大降低了云成本。同时,也根据客户的安全要求,制定了相关的安全优化策略帮助企业提高安全性,减少潜在风险
精细化自动停机策略,实现费用的全面优化:为了有效降低成本,我们在处理阿里云和Azure云的云服务时注意到,在关机状态和非关机状态下,收费差异非常显著,以云主机为例,关机状态下的费用仅为非关机状态费用的大约5%
为了减少非工作时间的资源开支,骞云平台提供了的定时策略开关机能力,实现了资源的自动启停,特别是在非工作时间,如工作日、法定节假日和调休日等。管理员可以设置全局策略,同时普通用户也有灵活配置策略的权限,当有特殊需求,如加班或其他情况,他们可以通过平台提交定时策略变更申请,经管理员审批后就可生效。一旦申请获得批准,系统会将相关资源从全局策略中排除,直到申请过期后再次自动加入到全局开关机计划中
这种方法使客户能显著降低开发和测试资源的费用,同时保持了系统的弹性和用户友好性,确保资源在需要时可供使用,同时在非工作时间降低成本。这为客户提供了经济实惠的解决方案,同时满足了灵活和效率的兼顾
组织级别的费用感知与责任下放:通过骞云平台的费用采集、分摊和分析功能,客户获得了可视化和多维度的云成本展示能力,使得云资源管理员、项目管理员、开发人员都能够更准确地了解和控制费用。通过对组织架构和配额的预设,骞云平台还帮助客户建立了清晰的费用责任制度,每个部门和项目管理员现在都能更直观地了解到他们的云支出,这使得他们能做出更明智的决策,降低成本
收 效 与 成 果
费用节省:上线后每月云成本节约25%。这个数字不仅非常直观和显著,而且对于企业来说是一笔非常可观的财务收益。费用的节省使得企业可以更专注于重要的项目和投资,推动企业的创新和增长
灵活性和高效性:通过资源的自服务管理,项目启动速度明显提快,资源获取和管理更灵活高效。资源优化策略的应用使资源使用率大幅提高,确保了资源的最佳利用
通过平台提供的组织和费用管控,企业现在能更全面地了解到资源使用情况。这对于项目的决策、资源的规划和性能优化都起到了至关重要的作用
财务的可持续性:由于费用感知与责任下放机制的引入,企业内部建立了更加明晰的费用责任制度,每个部门和项目都开始对云计算费用负起了责任。这鼓励了员工更积极的参与到费用管理,并更谨慎地使用资源
业务部门满意度的提高:资源管理自服务的引入不仅提高了资源获取的效率,减少了资源申请、变更的等待时间,以及费用数据的透明化都将更多的选择权交给用户部门
未 来 与 展 望
从上述案例分析可见,无论是中型企业还是大型组织,通过FinOps实践的引入,都可以提高资源利用率、并降低成本、实现更精细化的资源管理能力,在可持续性发展和社会责任方面作出积极的贡献。通过合理的工具改进资源管理和落地FinOps实践,企业将能够更好地应对未来的数字化挑战,创造更加繁荣的未来。未来,骞云科技仍将坚持推进IT资源管理服务体系和运维体系的进一步完善,提高整体行业的数字化水平。