实践案例 | 全方位守护业务的运行，构建高效监控与预警体系

科技 2024-10-16 07:45 广东

每工作日一、三、五早上07:45

准时为你带来最新产品资讯

面对突如其来的系统故障，如何快速解决？如何提升系统后续运行稳定性？本文将带你深入了解A客户如何通过构建高效的监控与预警体系，全方位守护其业务运行。通过一键部署gPaaS监控服务产品，实现了从应用层到IaaS层的全链路监控，及时发现并解决潜在故障，推荐阅读。

业务背景

A客户日常主要使用星瀚系统处理其订单数据。某日，该业务系统突然出现大面积瘫痪，影响客户业务订单的处理。经过现场工程师的紧急排查，发现是由于PostgreSQL数据库日志文件持续增长，导致数据库主机磁盘被占满，进而引发系统故障。对多余的数据库日志文件进行清理，预留足够的磁盘空间后，系统才得以恢复正常。

因此，客户希望能对业务系统建立一套全面的监控与预警体系，及时发现并解决潜在故障，确保系统的稳定运行。

解决方案

方案整体思路

通过安装器一键部署gPaaS监控服务产品，对业务系统环境的应用层-苍穹应用指标、PaaS层-容器/中间件/数据库指标和IaaS层-主机指标，进行全链路的监控及预警。

关键步骤及效果展示

1、安装部署

通过安装器，将业务系统开发环境和gPaaS监控服务一起安装（图1）。安装完成后，在监控服务的环境管理页面可查询到该业务系统开发环境信息。接着，再使用安装器依次安装业务系统SIT、UAT和生产环境，然后通过监控服务的环境管理页面，手工将这三套新装环境的信息配置上去（图2）。最后，用户便可以通过一套gPaaS，同时监控项目上的所有业务系统环境。

安装器一键安装（图1）

gPaaS监控服务环境配置（图2）

2、指标查询

gPaaS监控服务为星瀚业务系统预置了针对性的监控模板。gPaaS监控服务部署好后，即可通过监控服务对环境的全链路（苍穹应用、数据库、中间件、容器和主机）指标数据进行查询（图3和图4）。

监控座舱（图3）

左右滑动查看更多>>

各维度模块指标（图4）

3、报警通知

配置好接收报警的运维人员邮箱和云之家信息。当业务系统环境出现潜在故障时，监控服务能及时生成对应的报警事件（图5），并将报警通知同步发送至运维人员的邮箱和云之家（图6）。

针对客户环境运行情况，对默认报警策略进行更新（图7），使得报警更具针对性。

报警事件（图5）

报警通知（图6）

更新报警策略(图7)

4、自定义监控

监控服务基于Prometheus对所有环境运行数据进行自动采集和存储。默认采集500+运行指标（图8），若当前默认指标图表无法满足监控需求，可通过界面新增指标图表，并引用这些指标（图9）。

采集的指标（图8）

指标图表配置（图9）

方案的可推广价值

对客户的价值：

A客户项目使用该方案后，提前发现了多起主机磁盘、内存不足的问题，然后及时进行了处理，有效地避免出现业务故障。

行业的普适程度：

该方案可应用于苍穹、星瀚、星空产品的私有云及公有云环境监控运维场景中。
为客户提供提简单易用、全链路覆盖的指标监控及预警能力。目前已有超过50+家客户使用了该监控服务。据不完全统计，该方案使客户系统运行稳定性平均提升了40%以上。

相关资料

1. gPaaS监控服务整体功能介绍

https://vip.kingdee.com/link/s/lnYny

2. 监控服务安装部署介绍

https://vip.kingdee.com/link/s/lnYnV

#往期推荐#

# 实践案例 | 对接第三方CI/CD平台，实现苍穹代码自动构建与发布

# 实践案例 | 业务流之可监控的数据同步，助力企业高效协同

# 实践案例｜轻轨线（CI/CD）助力苍穹定制化研发项目管理

# 实践案例｜单据关系图，为你呈现脉络清晰的单据关系

对文章有任何疑问或建议，欢迎评论区留言~

PaaS平台那些事

分享苍穹最新特性、功能使用和开发小技巧、最佳实践等，做苍穹用户的知心朋友

最新文章

工作流审批集成手写签名，审批更便捷安全

菜单导航个性化定制：内嵌模式、浅色风格

苍穹安装器，让操作系统选型不再困难

动态配置，即刻连接：自定义数据库连接上线！

敏感词库与PII脱敏配置，让AI更安全可信！

插件快速查询，帮你告别低效人工定位

一文带你了解集成云方案库的“明细资源”！

“PaaS平台那些事”：苍穹平台特性文章合集（截至2024/12/3）

无代码变量选择器，助你效率翻倍

开放事件，让平台更开放，让集成更实时！

全新列表方案过滤，更强大更便捷

“一键迁移”：集成方案无缝转换为数据流

大模型自定义提取，帮你实现任意版式文档信息提取

慢接口预警，您优化接口性能的好帮手

父子流程嵌套可穿透，流程管理收放自如

全新苍穹助手门户，打造你的AI管理助手

报表管理新招：一键配置列头排序与过滤功能！

手把手教你做“权限初始化”！

打印客户端全新升级，支持本地打印及预览

拖拽排序，轻松掌控你的数据！

数据管理新利器：无代码表格，让效率翻倍！

集成管理首页工作台，全局功能轻松拿捏！

苍穹水平分库：驾驭海量数据的不二选择

自动获取汇率，让外币业务更高效！

轻扩展，集易用、安全、高效于一身的开发模式

数据工作台，AI增强的一站式数据工作中心

苍穹运维巡检卫士V2.0，运维更高效便捷

赢取好礼 | 金蝶云社区邀你参与满意度调研，分享你的声音！

企业集成新策略：事件网格，让企业数据实时流动！

轻报表新版数据集设计器：让数据准备 So Easy！

大模型上下文长度优化与通用能力提升，助力高效财务分析！

苍穹智能问答，秒懂你的需求

苍穹编程助手，开启AI编程新纪元

实践案例｜某集团收付款单成本中心数据隔离方案

实践案例 | 以A集团为例的多维库推送异构系统实践方案

实践案例｜“自由分配“控制策略场景下，客商权限的管控实践

实践案例 | 解锁模糊查询新技能：轻松实现大小写无关的搜索

实践案例｜揭秘从Oracle EBS到金蝶云·星瀚的数据迁移之旅

实践案例 | 全方位守护业务的运行，构建高效监控与预警体系

实践案例 | 轻分析取数，搭建财务系统驾驶舱

实践案例 | OpenAPI简化系统集成，赋能数字化转型

实践案例｜单据关系图，为你呈现脉络清晰的单据关系

实践案例 | 对接第三方CI/CD平台，实现苍穹代码自动构建与发布

实践案例 | 远光商旅集成，费用精细化管理的高效实践

实践案例 | 流程自定义弹窗校验，保障资金审核支付安全

“PaaS平台那些事”：苍穹平台特性文章合集（截至9/23）

实践案例｜自定义向导式卡片，系统操作更轻松

实践案例 | 无缝对接：揭秘SAP到苍穹的数据同步之旅

实践案例｜基金信息投资管理系统，“业务流+工作流”的创新应用！

苍穹产品实践案例推荐 | 流程服务云篇

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉