骞云统一运维管理平台 V8.0 正式发布

文摘   2024-06-06 11:03   上海  

本月,骞云统一运维管理平台8.0大版本发布!这标志着骞云平台的一次重大飞跃,体现了产品能力的显著提升。此次更新涵盖了多个方面,包括:

  • 众多云平台和云产品的新增和完善
  • 大量生产环境开箱即用的软件数据库中间件的自动化和监控

  • 全新的SQL编辑器功能

  • 各种资源类型的监控告警能力优化

  • 费用分析FinOps功能完善

通过这些功能的不断迭代,骞云统一运维管理平台已经从一个以IaaS为主的云运维管理平台,发展成为涵盖IaaS、PaaS、GPU、软件、物理设备等各种IT资源的全生命周期管理平台。平台现已具备从流程+自动化,到申请、配置管理、监控、告警、日常访问(如执行Shell和SQL操作等)、费用管控和优化的全面能力,成功打通了IT资源、流程、运维和成本等多条线,打破资源孤岛,实现全面集成和高效管理,极大地提升了平台的综合竞争力和用户体验。

01

  云平台对接和资源管理

1.更多云平台和云产品支持和完善

· 全新支持对接云宏WinStack,支持VM的创建、导入、更新和删除

· 全新支持对接Oralce Cloud,支持VM的创建、导入和删除

· 支持阿里公有云RAM用户的创建,重置密码和删除

· 支持阿里公有云RabbitMQ的创建、导入和删除

· 支持阿里公有云OSS完全托管方式的创建

· 支持阿里云企业级安全组的创建

· 阿里公有云云主机支持数据盘备份策略及备份状态展示

· 阿里公有云RDS支持备份策略及备份状态展示

· 阿里公有云RDS创建时支持输入一个或多个IP地址和IP段加入白名单

· 支持阿里公有云NAT网关独立创建,并支持关联/解绑EIP、创建/删除DNAT条目、创建/删除SNAT条目等操作

· 支持通用云ECS(阿里云)申请时VPC和交换机,基于服务配置检验申请时参数是否可见跳过参数校验

· 支持阿里云NAT网关DNAT/Forwarding

· 支持Azure MySQL Flexible(灵活服务器)部署

· 支持Azure Kubernetes Service(AKS)经典网络部署

· Azure虚拟机支持备份策略以及备份状态展示

· Azure SQLServer 新增 Save Money 参数配置

· 支持Azure Cache for Redis部署完资源详情显示Cachekey

· Azure Kubernetes Service(AKS)支持设置禁用公网访问,支持专用终结点创建、删除以及DNS中对应A记录删除

· Azure Key Vault密钥保管库支持设置禁用公网访问,支持专用终结点创建、删除以及DNS中对应A记录删除

· Azure Container Registry容器注册表支持专用终结点创建、删除以及DNS中对应A记录删除

· 支持华为公有云独立组件K8S集群(CCE)的创建、导入和删除

· 支持华为公有云短信模板的创建、导入和删除

· 支持华为公有云NAT网关的创建、导入、同步和删除,支持创建/删除DNAT条目、创建/删除SNAT条目等变更操作

· 支持VMware vSphere 6.x和7.x版本的云主机跨VC迁移和克隆

· 支持F5负载均衡SNATPOOL手工指定IP功能

· 对接深信服支持版本号配置,兼容更多版本

· 全新支持K8s Service创建、导入、删除和同步

· 支持华为Fusion Compute使用资源池部署

· 支持IP地址组件申请时选择IP地址目录,并支持IP地址的预占用/释放/占用等标准流程


2.物理机优化完善

· 物理机资源详情支持显示ssh端口/远程协议类型&端口信息,并且SSH端口/远程协议类型&端口操作支持授权

· 物理机的创建导入都支持命名规范,并支持在规范中使用IP地址

· 统一所有软件创建、采集和导入资源的命名规则,避免创建的资源也会被导入

· 支持裸金属云物理机硬件信息重新发现,并支持批量设置启动盘,网络等信息

· 支持ARM物理机的自动装机过程


3.更多软件单机和集群的部署及配置完善

· 支持软件组件ElasticSearch(v7.16.2,v8.5.1)单机和集群(3节点集群),并添加ElasticSearch的集群部署蓝图,支持多节点可配置节点数量

· 支持软件组件MongoDB(v5.0.21,v6.0.6)1主1从1仲裁,并添加MongoDB的集群部署蓝图,支持主从仲裁可配置节点数

· 支持软件组件PostgreSQL(v12.16,v14.9)单机、主从2节点,并添加PostgreSQL的集群部署蓝图,支持主从可以配置节点数量

· 支持软件组件RabbitMQ(v3.12.10)3节点,并添加RabbitMQ的集群部署蓝图,支持多节点可配置节点数量

· 支持软件组件Redis(v5.0.14,v7.2.0)单机和集群(1主2从3哨兵),并添加Redis的集群部署蓝图,支持主从哨兵模式配置节点数

· 支持软件组件RocketMQ(v5.1.3)2主2从同步刷盘,并添加RocketMQ的集群部署蓝图,支持主从可以配置节点数量

· 支持软件组件Weblogic(v12.2.1.4.0)集群

· 支持keepalived软件

· 支持Nacos v2.3.0 软件单机和集群

· 完善内置软件组件MySQL/Kubernetes/Kafka集群名称和描述


4.支持常用数据库的SQL编辑器功能

· 添加数据库的资源菜单,方便对所有数据库的访问

· 完善数据库组件属性,支持关系型数据库的SQL Editor

· 有授权的用户,可以在数据库资源的列表和详情打开SQL编辑器

· 支持查看数据库的库表结构,用户和系统信息

· 支持SQL编辑、执行、查看结果以及结果的导出等


5.键值标签优化

· 新增键值标签管理菜单,支持预置标签,并支持配置单个标签是否必填

· 申请&运维操作时,自定义的键值标签默认不展示,用户输入键后有匹配键值才显示,同时支持手动输入

· 云资源列表支持展示键值标签并支持过滤,支持批量设置键值标签

· 支持将用户申请时选的资源环境标签自动打上资源的键值标签


6.完善云资源的操作

· 阿里/腾讯公有云支持使用密钥类型的凭证创建云主机

· 优化阿里云公有云和Apsara组件,明确区分云平台类型

· 支持阿里/华为/腾讯公有云云主机按需和包年包月互转

· 取消对云主机热调配必须在关机情况下的限制,在开机状态下,资源变配是否成功取决于云平台的执行结果

· 支持腾讯公有云EIP申请时询价

· 支持通过API获取AWS实例规格,之前需要在平台手工配置规格列表

· 在云上更改云主机资源配置后,同步到平台自动生成变更记录并触发计费节点

· 阿里云添加云平台规格时支持配置资源池

· 优化VMware vCenter虚机模板时的报错信息

· 优化资源的付费模式和到期时间展示,新增到期时间,到期前7天展示成红色

· 支持蓝图内的VM集群通过依赖获取完整的集群的所有节点的信息

· 执行脚本操作支持参数(包括表单)传值

02

  ITSM和服务申请完善

1.服务配置和服务申请页面完善

· 将ITIL的Request的中文请求改为申请(Request),包括单个和批量

· 优化Markdown描述框固定高度为240px并支持拖拉拽框的大小

· 优化Markdown描述内容在列表限制展示文字数量

· 优化Markdown编辑器富文本插入的链接打开方式改为新窗口打开

· 支持申请人在申请通用云的VM时手动选择IP池里面的可用IP

· 优化基于服务配置检验申请时参数是否可见,支持通用云ECS申请时VPC和交换机未填值能够跳过参数校验

· 调整阿里云、AWS、Azure VM的网络属性参数,支持基于通用云卡片网络可见可改配置生效

· 优化可选资源环境标签过滤和资源池逻辑,支持配置服务卡片时显示所有的资源环境标签、可选资源池、资源池

· 申请页面支持通过定制JS获取服务的表单配置和值


2.工单优化

· 工单支持挂起操作,挂起后SLA支持暂停计时


· 工单服务配置申请时选择SLA支持手动选择SLA,并可以配置可见可改


· 申请/审批选择SLA时,下拉SLA支持按照响应时间(由长到短)排序

· 工单详情显示提交时间

· 优化工单流程变更时给申请者的通知消息(邮件/钉钉/微信等)

· 服务工单SLA状态发生变更&工单处理结束后的消息通知中支持配置工单链接地址

· 支持内置的ITIL管理员(事件/问题/申请/变更)以及平台管理员在任意处理流程进行所有操作


3.批量申请单优化

· 支持申请单统一选择申请者/所有者

· 申请单的业务组配置为非必填时,支持通过应用系统选择对应的业务组

· 申请单自定义表单支持申请审批可见可改配置

· 申请和运维操作时支持配置是否允许直接提交申请


· 实现所有运维操作支持加入申请单通用实现方法,并支持vsphere迁移/克隆/快照等变更操作加入申请

· 提交初始化失败的申请单支持释放预占用的资源(CPU/内存/存储/IP等)

· 申请单页面直接展示服务目录及卡片


4.流程优化

· 请求单/工单处理流程支持审批阶段前任意添加user task配置退回操作


· 优化第三方集成的运维操作审批,支持一个接口获取所有表单实现云资源的Day2操作的详细信息和参数

· 使用异步调用方案来实现integration任务和云资源运维任务,避免脚本等待过长导致的任务超时

· 完善第三方服务集成资源环境的配置,在流程配置中支持资源的资源池配置的资源环境标签过滤服务集成

· 卡片消息构造时支持审批id的传入,支持将上下文信息直接传到第三方消息里面

· 处理流程新增高级配置,任意阶段支持配置参数可见可改


5.服务集成

· 支持阿里公有云堡垒机,创建ECS后完成虚拟机的自动注册,卸除后可以自动注销

· 优化内置的审批集成示例为基准通用对接


03

  云监控告警

1.完善监控数据采集

· 平台组件监控支持Prometheus Exporter的Multi-Target模式,能够使用一个Exporter同时监控多个实例

· 调整SNMP Exporter的自动化脚本,支持Multi-Target模式

· 调整MySQL Exporter的自动化脚本,支持Multi-Target模式

· 扩展SNMP Exporter的监控对象,支持物理机以外的各种物理设备


2.灵活的告警规则定义

· 基于输入表达式和选择触发条件构造PromQL表达式

· 支持指标聚合,可以按需配置分组层级和函数

· 支持配置持续时间,持续时间内告警不会触发

· 支持云平台监控模式下不依赖监控agent的宕机告警(依赖云平台的监控数据,目前支持VMWare VM)


3.告警相关优化

· 优化没有健康状态分析算法的资源展示,已安装监控时健康指数统一为健康,资源状态图显示为绿色

· 更新NodeExporter版本到1.8.1

· 支持ARM架构Linux的NodeExporter安装和自动化配置

· 支持通用的Webhook 告警集成,兼容各种告警系统

· 支持阿里公有云ECS监控指标CPU和内存最大值,从而更好支持FinOps优化场景

· 优化告警模板&告警规则支持国际化

· 新增MySQL相关的告警模板

04

  云费用分析和FinOps

1.公有云帐户金额告警分析和告警

· 支持公有云(阿里云,华为云,腾讯云)费用获取,并在云账户详情展示账户的余额和信用额度等信息

· 支持公有云(阿里云,华为云,腾讯云)费用的告警

i.支持用户设置自定义费用告警(阈值告警&预测告警)
ii.支持定义费用(现金余额&信控余额&可用余额)告警规则,设置费用触发条件,触发后会发送告警通知


2.费用相关优化

· 费用分析仪表盘针对不同角色权限的用户看到自己有权限的相关费用

i.业务组费用分析仪表盘,业务组管理员只能看到自己管理的和所在的业务组的相关费用
ii.应用系统费用分析仪表盘,应用系统管理员只能看到自己管理的和所在的应用系统的相关费用
iii.用户费用分析仪表盘,用户只能看到自己有权限的相关费用

· 查看费用分析时,使用业务组过滤,选择一个业务组后自动选中该业务组下所有层级的全部子业务组

· 配置预处理分摊规则,取消业务组、应用系统和所有者的强制过滤关系

· 支持阿里公有云存储包(OSS/快照,数据库备份,NAS)的账单分析获取和分摊

05

  移动端

· 支持企业微信小程序,支持登录、查看我的资源、我的申请、我的审批以及审批等功能


06

  平台完善及UI/UX优化

1.智能分析平台优化

· 智能分析的报表系统取代老的报表系统,同时关闭老的report服务及对应的菜单

· 调整所有内置大屏、仪表盘以及报表的名称,并基于ACL权限控制优化默认访问角色

· 智能分析二级菜单树目录以及菜单权限支持国际化

· 优化智能分析大屏、仪表盘以及报表分享后依旧支持右上角点击导出Excel的操作

· 支持大屏表格组件自动滚动功能

· 优化大屏、仪表盘以及报表名称

· 新增了一个支持展示资源/业务组/应用系统整体信息的【组织和资源概览】仪表盘

· 新增了一个【云资源情况】报表

· 新增了一个不带费用数据展示的【云资源大屏】

· 新增了一个【业务组概览】仪表盘


2.UI/UX优化

· 菜单配置新增平台管理菜单模块开关和授权的配置

· 新增菜单配置别名功能

· 调整内置欢迎页模块组件名称

· 所有的下拉框支持用户手动拖拽调整大小,避免固定大小导致信息展示不完整

· 查询资源的列表资源类型筛选下拉支持按照已有资源的类型来过滤

· 完善蓝图页面展示组件所属的云平台,搜索后,匹配的icon在每个分组下分别展示

· 业务组点击父业务组右侧和其他业务组一样,直接显示当前选中父业务组的概览

· 优化列表页面性能,缩短工单和操作历史拉取数据起止时间范围默认为过去一个月

· 支持office文档等更多的文档的在线预览

· 作业管理/应用发布流水线/智能巡检/采集的下拉任务需要能够按照类型来过滤,只展示合适的任务

· 启用的服务目录在没有任何已发布卡片或应用栈时,服务目录和应用栈两个菜单页面隐藏该目录

· 支持业务组/应用系统名称及简称的名称校验配置(是否必填/正则校验)


3.表单完善

· 表单设计的视图模式支持更多的配置项,支持配置可见可改,自动选择等

· 表单扩展属性值是link时支持点击跳转


4.平台后台功能完善

· 完善平台VM部署的健康状态检查工具,支持巡检报告邮件发送

· 完善平台多VM的部署架构,支持ES,Redis, RabbitMQ几个服务都独立部署的方案

· 优化ES系统的日志保存,减少日志的文件占用

· 优化双因素认证,支持一段时间内不需要重复认证,时长可以配置

· 支持LDAP用户编辑个人资料的手机号/邮箱/微信/钉钉/飞书/联系人姓名/联系人邮箱

· 支持将用户同时加入多个指定的业务组和应用系统

· 优化邮件告警模板,支持显示云资源IP地址字段

· 平台配置多个Listener节点,支持从多个节点中动态选择,支持高可用和高并发情况


5.平台系统模块升级和安全加固

· 平台支持部署到x86架构Anolis OS 8

· 容器环境支持覆盖系统默认钉钉审批、流程处理通知模板,显示客户需要的通知内容

· 升级系统grafana版本从8.5.9到8.5.27

· spring amqp升级到2.4.17

· API调用的乐观锁的优化,当API不传lockversion的时候,直接更新数据

· 安装升级脚本中支持自动处理客户配置的证书

· CMP的软件安装包/gateway安装包/exporter安装包下载路径安全漏洞修复


    更多详细功能,您可登录骞云官网www.cloudchef.io,或扫描下方二维码,即刻免费体验骞云SmartCMP SaaS平台的强大功能!如您在使用过程中遇到任何问题,欢迎致电400-036-1181或E-mail至support@cloudchef.io联系我们,我们将竭诚为您服务

 降本增效,某新能源车企平台工程和FinOps案例介绍
 平台实操指南|骞云平台与堡垒机对接方案进阶版
● 平台实操指南|如何在骞云平台配置和集成第三方堡垒机
● 骞云统一运维管理平台V7.7.2发布,SmartCMP SaaS 2024 Update 2
● SmartCMP SaaS 2024 Update 1|重磅升级,功能优
● 骞云科技算力运营运维方案介绍
● 骞云统一运维管理平台V7.7发布
● 降本增效,知名快消企业FinOps落地实践

骞云科技CloudChef
中国云原生管理领域领导者,建设数字化企业,释放云上生产力!
 最新文章