发现设备重大隐患 确保高铁行车安全
北京移动交换中心系统承担北京局管内全部GSM-R通信业务,是实现车机语音、数据通信、C3级列控通信、调度命令下发等重要行车业务功能的重要系统。
10月5日凌晨3:04分起至4:42分止,全局通信核心设备北京移动交换中心(MSC)网管共五次上报北京移动交换中心服务器11(MSCS11)的话务处理板、话务与信令处理板单板故障告警。
此时正值“十一”国庆黄金周期间
列车旅客流量巨大
设备安全重于泰山
故障处理时间分秒必争
通信段主管领导火速到达现场指挥故障处理
通过对该设备的机框管理板进行复位和主备切换操作
告警未再上报,未产生业务影响
分析故障原因为
车载终端上报信令数据与规范存在差异
导致核心网设备板件工作异常
为防止故障原因定位有偏差
G网车间在段领导的组织下
对故障设备进行预防性处置
6日天窗点,将隐患板件进行了全部更换
并组织各现场车间进行全面业务拨测
业务拨测验证均正常
北京通信段组织技术力量
对故障进行持续跟踪分析
协调相关电务段车载设备对呼叫记录等相关信息进行了协查定位
再次印证故障原因
段先后召开了现场分析会及重点问题专题会议
指派技术骨干前往华为西安技术实验中心
进行故障复现
15日天窗,组织G网车间利用长龙公司CIR设备在核心网网管再次进行故障现场复现
复现结果均与故障分析一致
该隐患为MSC设备的故障问题
在部分铁路局均共性存在
北京通信段深入挖掘故障成因
率先提出了应对措施:
故障定位:因CIR终端设备上报异常字符串引发局核心MSC设备板块重启。
措施:一是完善既有设备应急处置手段,开发分析工具及时定位异常终端用户并采取相关处置措施;二是持续追踪CIR设备软件版本更新工作,降低设备对局核心设备影响。
供稿人:赵红光 田晓菲