加强数智技术创新
提升安全预警与应急处置能力
为贯彻落实集团和软研院工作要求,守好安全生产底线,哈尔滨分院计费结算分中心坚守保障生产稳定的初心,通过加强技术创新提升生产安全预警和应急处置能力,目前已经实现全国话单管理系统全业务流程的自动化容灾能力上线,为生产安全提供有力保障。
随着联通5G业务快速发展,话单管理系统承载的用户话单量逐年攀升,对生产安全保障能力提出了更高要求。同时交换设备等基础设施资源的优化变更,对各省、大区前置节点应用的运行稳定性均带来了一系列的风险与影响。为应对这一挑战,计费结算分中心成立专项攻坚团队,以全面实现生产系统持续稳定、实时、准确运行为目标,着力聚焦以下关键领域进行技术创新与优化升级。
PART 01
话单采集实时效率智能化检测
全面引入数智化AI模型对计费采集系统前置接口下载效率进行智能化检测,覆盖全国各省、市、自治区与直辖市分布的云网交换设备5000台以上,采集数据源70000个以上。智能化检测聚焦每一个采集数据源的采集效率,通过预研人工智能技术,基于各设备历史采集指标与数据,结合异常场景充分进行模型训练,最终在生产环境中实时筛选出采集效率异常的采集数据源,发出告警并同时进行自动化处理,保证每一个采集数据源的处理效率,为后续计费环节不受影响打下基础。
话单采集实时效率智能化检测共完成4次异常采集点的准确识别,实现异常采集点的自动化分流处理,将问题定位准确率由人工定位的30%提升至自动化定位的100%,解决了在众多采集点中排查出异常采集点准确率的问题。
PART 02
话单流转关键节点自动化容灾
全面实现“系统异常上下游接口”、“系统异常中间件”等重点环节的自动化隔离与切换,通过对话单处理环节的关键应用进行自动化容灾改造,使其具备在操作中间件或调用上下游接口时的自动化容灾能力。同时攻坚团队聚焦生产运维痛点,为彻底解决生产环境中由中间件性能降低引起的业务积压问题,攻坚团队对应用的处理逻辑进行了进一步的复盘、分析、设计与改造,使其具备根据调用接口效率触发的自动化切换能力。通过以上对计费环节关键应用的改造全面降低了用户话单采集与计费延迟风险,节约了生产运营实时监控与应急的成本投入。
话单流转关键节点自动化容灾已对接Kafka、MinIO组件集群和下游主机的高效监控与即时判断,实现异常后执行预设的业务切换流程,故障处理时间缩短了70%,解决了人工参与变更速度慢的问题。
数智化技术的创新性使用全面提升了计费流程的安全预警与应急处置能力,计费结算分中心将谨记初心,勇担使命,以新发展理念为指引,聚非常之力、尽担当之责,全体上下必将继续以强烈的使命感、责任感与紧迫感筑牢中国联通计费结算安全防护网,以数智强企真抓实干、开拓创新,为网络强国、数字中国的高质量发展再创佳绩!
图文 | 计费结算分中心 赵旭东
编辑 | 计费结算分中心 张先丽
审核 | 鲁巍 张先丽
校对 | 党委办公室(办公室)