朱英齐, 王倩琳, 张东胜, 等丨基于报警日志的炼化过程风险薄弱点深度挖掘

文摘   2024-05-01 11:28   北京  

点击上方蓝字关注我们

基于报警日志的炼化过程风险薄弱点深度挖掘

朱英齐 1,2  王倩琳 1,2    张东胜 1,2   窦站 1,2   张建文 1,2

1. 北京化工大学机电工程学院,北京 100029
2. 北京化工大学安全工程交叉学科研究中心,北京 100029

DOI:10.12034/j.issn.1009-606X.223202

摘 要 在复杂炼化生产过程中,工艺报警日志蕴含着丰富的潜在风险信息,有助于揭示危险性根源、预防过程安全事故发生。为此,本工作提出了一种基于报警日志的炼化过程风险薄弱点深度挖掘方法。首先,针对本工作类型的工艺报警日志,利用Word2Vec词嵌入技术进行向量化预处理,同时通过Pearson相关系数法解析日志间的关联关系,以获取相关系数矩阵。其次,引入复杂网络(CN)理论,将相关系数矩阵转化为布尔矩阵,构建复杂炼化过程的风险表征网络模型。再次,采用逼近理想解排序法(TOPSIS)对所构建的网络模型开展节点重要度精确评估,主要涵盖度中心性、接近中心性和特征向量中心性3个指标。最后,根据网络节点重要度排序的优先级,可深度挖掘复杂炼化过程的风险薄弱点。以某套柴油加氢装置为例,分析结果表明,该方法可准确、有效地提取报警等级为“高高报(HH)”或“高报(HI)”的工艺报警日志,且与复杂炼化过程的实际运行工况相符。
关键词 风险薄弱点;报警日志;节点重要度;复杂网络(CN);逼近理想解排序法(TOPSIS)

1 前 言

随着《中国制造2025》战略实施,智能工厂已成为当代过程工业领域的主流,炼化产业亦不断转型升级——数字化、信息化、智能化和智慧化趋势日益凸显[1]。然而,炼化作为高危行业之一,危险源种类众多、工艺流程繁杂,容易发生严重的人员伤亡、财产损失或环境污染等事故,造成极其恶劣的社会影响[2-4]。因此,亟须集成数据挖掘、人工智能等技术手段开展过程风险管理,为炼化行业的安全平稳运行、绿色低碳发展保驾护航。
分布式控制系统(DCS)、数据采集与监视控制系统(SCADA)、先进过程控制(APC)及工业电视等过程监控系统能够实时采集和记录各类生产数据,是工业4.0建设的重要标识[5]。其中,工艺报警日志属于核心数据之一,其蕴含着丰富的潜在风险信息,常涉及“系统-装置-设备-元件”空间尺度与“年-月-日-分-秒”时间尺度,这将有助于深层次揭示复杂炼化过程的危险性根源,从而有效预防过程安全事故发生[6,7]。目前,众多专家和学者对工艺报警日志管理开展了一系列的研究工作。例如,Meng等[8]将隐藏在危险与可操作性分析(HAZOP)报告中的偏差传播关系转化为报警优化的关键信息来源,以迭代升级工艺报警管理系统;Kaced等[9]针对过程变量所存在的耦合性问题,将传统的主成分分析(PCA)改进为多变量方法,从而减少了滋扰报警频率;García等[10]考虑减少监控报警的需求,提出了一种自动的报警优先级排序法,该方法能够过滤无效报警。然而,现有研究大多以消除冗余、抖振报警等为导向,尚未充分分析、挖掘和利用工艺报警日志所蕴含的大量风险信息,因此相应的风险评估效果不显著。
复杂网络(CN),即呈现高度复杂性的网络,具有自组织、自相似、吸引子、小世界、无标度中部分或全部性质[11,12]。如今,CN已在过程风险评估领域得到越来越广泛的应用。例如,岳希坚等[13]通过CN模型研究油库安全风险管理,同时提出一种辨识关键风险因素的理论方法;Yang等[14]利用人因分析和分类系统(HFACS)对来自中国的109份调查报告数据(2015-2020)进行分类,并输入CN模型,从而生成了风险链;Duan等[15]引入CN模型,设计一套新的框架来探索建筑工人轨迹中安全风险的时空模式;Ullah等[16]提出一种新的启发式算法——基于局部性的结构系统(LSS),即基于网络节点的局部信息,而非全局信息确定节点重要度;Dong等[17]提出一种基于信息通信概率和相对熵(CPR)的网络节点重要度排序技术,从全局、局部和位置信息维度识别CN模型的关键节点;Kang等[18]绘制CN拓扑图,并根据度中心性、接近中心性和介数中心性3个指标,以获取节点重要度排序。由此可见,CN模型可成为复杂炼化过程风险评估的重要抓手,但上述研究均以过程系统中装置或设备的向量化数据为基础。因此,如何清洗和处理文本类型的工艺报警日志,将其与CN模型相结合,目前相关研究尚处于空白状态。
为此,本工作提出了一种基于报警日志的炼化过程风险薄弱点深度挖掘方法。首先,针对文本类型的工艺报警日志,利用自然语言处理(Natural Language Processing, NLP)中的Word2Vec词嵌入技术,进行向量化预处理,使其能够被计算机识别,并获取初始矩阵;同时通过Pearson相关系数法解析报警日志间的关联关系,获取相关系数矩阵。其次,引入复杂网络理论,将相关系数矩阵转化为布尔矩阵,构建复杂炼化过程的风险表征网络模型。再次,以度中心性、接近中心性和特征向量中心性3个指标为基础,采用逼近理想解排序法(TOPSIS)对所构建的网络模型开展节点重要度精准排序。最后,根据网络节点重要度排序的优先级,深度分析和挖掘复杂炼化过程的风险薄弱点。

2 基本理论

2.1 Word2Vec词嵌入

Word2Vec词嵌入作为NLP的核心技术之一,属于一种从大量文本语料中开展无监督学习语义知识的模型[19,20]。本工作利用Word2Vec词嵌入,将工艺报警日志进行文本转换与量化,即通过分词分割成多个词向量,并对每个词向量进行编码,此时每条报警日志转化为矩阵,再结合随机权重矩阵,生成向量矩阵。此外,需通过Softmax进行归一化及回归分类,将每个词向量输出为0~1的概率,且所有节点概率之和为1,即可获取每个词汇的概率。通过梯度下降法不断地优化随机权重矩阵,并结合每个词汇编码,即可获取Word2Vec向量化处理后的初始矩阵。

2.2 Pearson相关系数

在统计学中,Pearson相关系数用于研究两个或两个以上处于同等地位的随机变量的相关关系的统计分析;在数据分析中,Pearson相关系数用来探测两组数据之间的相关关系,如变化趋势是否一致、是否存在正向或负向联系及关系的强弱等。Pearson相关系数能够反映两个变量间的线性相关性强弱[21,22]。该系数的取值为-1~1,绝对值越大、相关性越强,绝对值越小、相关性越弱。如式(1)所示,若Pearson相关系数()接近1或-1,则强相关,若接近0,则无相关。

(1)
式中,分别代表某一个向量,分别代表向量的平均值。

2.3 复杂网络

复杂网络是一种从现实世界系统中通过一定高度抽象所获取的具有复杂结构和特性的网络[11,12]。复杂网络将复杂系统中的元素抽象为节点,元素间关系抽象为边。
其中,小世界性是CN的重要拓扑特性之一[23]。小世界现象,即意味着网络中随机两个节点间的距离短,可通过聚类系数的相对比值与特征路径长度的相对比值进行表达。如果满足式(2),可判定复杂网络具有小世界性。

(2)
式中,分别代表复杂网络完全随机的聚类系数和特征路径长度,分别代表真实网络的聚类系数和特征路径长度。
此外,中心性亦是复杂网络的重要拓扑特性之一[24],大致分为度中心性、介数中心性、接近中心性、间接中心性、紧密中心性及特征向量中心性等。经分析,本工作重点以度中心性、接近中心性和特征向量中心性为核心指标,求解复杂网络的节点重要度。
(1) 度中心性():刻画节点中心性的最直接的衡量指标。如式(3)所示,某节点的度值越大,则该节点的度中心性越高,即节点在复杂网络中越重要。

(3)
式中,代表与节点相连的边的数量,N-1代表节点与其他节点均相连的边的数量。
(2) 接近中心性(CC):如式(4)所示,平均距离的倒数即为接近中心性。

(4)
式中,代表节点距离,代表节点个数。
(3) 特征向量中心性(EC):如式(5)所示,某节点的重要性取决于其邻节点的数量(即节点的度),亦取决于其邻节点的重要性,与之相连的邻节点越重要,则该节点就越重要。

(5)
式中,代表节点的重要性,代表比例常数。假设,经过多次迭代达到稳态时,可记作,即代表矩阵的特征值所对应的特征向量。

2.4 逼近理想解排序法(TOPSIS)

逼近理想解排序法(Technique for Order Preference by Similarity to an Ideal Solution, TOPSIS)是一种常用的、有效的多目标决策分析方法,该方法只要求各种效用函数具有单调递增或递减性质,又称为优劣解距离法[25,26]。该方法的基本原理是通过检测评价对象与最优、劣解的距离进行排序,如果评价对象最靠近最优解、同时最远离最劣解,则最佳。其中,最优解的各指标值均达到各评价指标的最优值,最劣解的各指标值均达到各评价指标的最差值。TOPSIS核心步骤是构造加权规范矩阵、确定正负理想解和计算相对贴近度,具体如下所示。
首先,以复杂网络的节点重要度为导向,即将各节点的度中心性、接近中心性和特性中心性作为输入,构造加权规范矩阵,如式(6)所示。

(6)
式中,代表标准矩阵,即节点重要度;代表第项评价因子的综合权重,且综合权重向量构成,即
其次,根据加权规范矩阵确定正负理想解。其中,正理想解代表加权规范矩阵中各指标所对应最大值的集合,负理想解代表加权规范矩阵中各指标所对应最小值的集合。
最后,将正负理想解作为输入,计算相对贴近度,如式(7)~(9)所示。相对贴近度越大,表示样本点距离正理想解越近,综合评价结果越优。

(7)

(8)

(9)
式中,代表第项至正理想解的距离,代表第项至负理想解的距离,代表加权规范矩阵,代表由加权规范矩阵确定的正理想解,代表由加权规范矩阵确定的负理想解。
一个复杂网络有许多节点,本工作的这些节点都由相应的报警日志数据组成,而报警日志数据本身表示的是一些风险信息,当某个节点的重要度越高时,代表其在整个网络中的重要性越高,并在整个网络的影响力越大,同时其具有的风险性越高;该复杂网络的各个节点都是由报警日志数据组成,因此风险薄弱点指的是在一个复杂网络中,将各个节点的重要度进行排序,其中节点重要度较高的节点即为风险薄弱点。

3 方法步骤

根据上述基本理论,本工作提出一种基于报警日志的炼化过程风险薄弱点深度挖掘方法,包括报警日志解析与建模、节点重要度精确评估及风险薄弱点深度挖掘3个步骤,如图1所示。

图1   技术路线图Fig.1   Flowchart of the proposed method

3.1 报警日志解析与建模

在复杂炼化生产过程中,工艺报警日志包含报警时间、位号名、报警描述、报警等级等文本类型数据。在日志文本转换时,本工作将位号名和报警等级定义为报警变量,相当于“单词”。利用Word2Vec词嵌入技术,可将报警变量映射为实值向量。这种词向量预处理不仅能够自适应地保留文本数据间的关联关系,还能够使得报警日志被计算机识别,从而获取其初始矩阵。
根据式(1),通过Pearson相关系数法开展相关性分析,解析报警日志间的关联关系,获取其相关系数矩阵。经设定相关阈值,将相关系数矩阵转化为布尔矩阵。参考文献[27],最优的相关阈值选为0.3。若ρ<-0.3或ρ>0.3,则强相关且布尔值为1;若-0.3<ρ<0.3,则弱相关且布尔值为0。按照复杂网络理论,分别将报警日志、布尔矩阵作为网络节点和邻接矩阵,据此可利用Gephi软件构建复杂炼化过程的风险表征网络模型。若此网络中各个节点的小世界性均满足式(2),可判定所构建的网络模型具有小世界性。

3.2 节点重要度精确评估

在上述风险表征网络满足小世界性验证要求的前提下,根据式(3)~(5),分别计算网络节点的度中心性、接近中心性以及特征向量中心性。将节点中心性作为输入数据,通过TOPSIS方法精确评估网络节点的重要度。即根据式(6)构造加权规范矩阵、确定正负理想解,并根据式(7)~(9)计算相对贴近度,获取各节点所对应的重要度。此外,本工作将TOPSIS的权重统一设定为0.25。

3.3 风险薄弱点深度挖掘

以TOPSIS方法的评估结果为基础,可对风险表征网络的节点重要度进行优先级排序,且重要度高的节点即视为风险薄弱节点。对于一个复杂网络,其中某个节点的重要度越高,代表其在整个网络中的重要性越高,并在整个网络的影响力越大,进而会影响整个装置或系统[28]。由于本工作中复杂网络的各个节点都代表相对应的报警日志,当节点的节点重要度较高时,其具有的风险性越高,因此该节点即为风险薄弱点。据此,利用Gephi软件绘制复杂炼化过程的风险薄弱点图,即可直观化地揭示高风险的单元设备或仪器仪表。

4 案例分析

柴油加氢作为炼油、化工的核心工艺之一,可解决脱硫、脱氮、调色和储存安定性等问题,从而不断降低多环芳烃含量,实现柴油高效稳定和清洁低碳生产[29]。某柴油加氢装置的工艺流程如图2所示,即在一定压力和温度条件下,油品经氢气、催化剂的作用,含有硫、氮、氧的有机化合物分子发生氢解反应,烯烃和芳烃分子发生加氢饱和反应。其中,涵盖原料油罐、过滤器、反应器、高分罐、缓冲罐、水洗罐、产品罐、柱塞泵等设备,以及流量计、压力计、安全阀、减压阀、放空阀等仪表。由此可见,柴油加氢装置涉及多种危险物料,且物质、能量的传输和转化工序繁杂,因此利用所提出的风险薄弱点挖掘方法对其开展过程风险评估研究。

图2   柴油加氢装置的工艺流程图Fig.2   The process flow diagram of diesel hydrotreating unit

4.1 报警日志解析与建模

该套柴油加氢装置的工艺报警日志详见表1,共计124条。通过Word2Vec词嵌入技术,获取79×79初始矩阵,结果详见表2。

表1   柴油加氢装置的工艺报警日志Table 1   Process alarm logs of diesel hydrotreating unit

Note: HI means high limit alarm setpoint; LL means low-low limit alarm setponit.


表2   报警日志的初始矩阵Table 2   The initial matrix of alarm logs


在初始矩阵的基础上,本工作采用Pearson相关系数法对报警日志开展相关性分析,以解析日志数据间关联关系,并获取79×79相关系数矩阵,结果详见表3。

表3   报警日志的相关系数矩阵Table 3   The correlation matrix of alarm logs


通过相关阈值,将表3的相关系数矩阵转化为布尔矩阵,详见表4。可直观看出该79×79布尔矩阵的数据完整性。

表4   报警日志的布尔矩阵Table 4   The Boolean matrix of alarm logs


分别将报警日志、布尔矩阵作为网络节点和邻接矩阵,并基于Gephi软件构建柴油加氢装置的风险表征网络,如图3所示。可看出该网络模型结构完整,没有孤立节点,网络节点间相互连接且关联紧密。此外,根据式(2)计算各网络节点的小世界性S值并绘制成图谱,如图4所示。由图可看出所有节点的S值均大于1,因此本工作所构建的风险表征网络模型满足小世界性。

图3   柴油加氢装置的风险表征网络Fig.3   A risk character network of diesel hydrotreating unit

图4   网络小世界性Fig.4   The small world of network

4.2 节点重要度精确评估

根据式(3)~(5),分别计算网络节点的度中心性、接近中心性和特征向量中心性,结果详见表5。将表5作为输入数据,通过TOPSIS方法精确评估网络节点的重要度,结果详见表6。其中,正理想解,负理想解,且相对贴近度

表5   节点中心性Table 5   Node centrality


表6   节点重要度排序表Table 6   The order preference of node importance


4.3 风险薄弱点深度挖掘

以TOPSIS方法的评估结果为基础,可对风险表征网络的节点重要度进行优先级排序,结果详见表6。此外,基于Gephi软件绘制柴油加氢装置的风险薄弱点图,如图5所示。

图5   柴油加氢装置的风险薄弱点图Fig.5   A risk weakness diagram of diesel hydrotreating unit
由表6和图5可直观看出,上述风险表征网络中节点重要度最高的是节点20,其次是节点3, 4和7。换言之,节点3, 4, 7和20即为该套柴油加氢装置的风险薄弱点。将这些节点与报警日志相匹配,获取信息如下所示:节点3—1/25 15:28 PI3117.VAL P1001C出口流量HI;节点4—1/25 15:08 FRC3101.VAL泵P1001A,B出口流量控制 HI;节点7—1/25 14:18 LICA3203 罐V1007边界控制 HI;节点20—1/25 04:38 FI3503 F101对流室最高压力HH。本工作要深度挖掘出的是复杂网络的风险薄弱点,而复杂网络的风险薄弱点对应的是具有高风险的报警日志。因此,挖掘出该复杂网络的风险薄弱点即可有效提取报警等级为“高高报(HH)”或“高报(HI)”的工艺报警日志。
其一,从柴油加氢装置工艺报警日志的报警等级分析。报警等级可分为“高高报(HH)”“高报(HI)”“低报(LO)”和“低低报(LL)”,其中隶属于高风险的是HH和HI。根据上述分析结果,可知节点20对应于HH,且节点3, 4, 7对应于HI。由此可见,本工作所提出的风险薄弱点挖掘方法可准确、有效地提取报警等级为HH或HI的工艺报警日志。
其二,从柴油加氢装置工艺报警日志的报警描述分析。节点20代表对流室最高压力,在此工艺流程中,对流室内烟气会以高速冲刷炉管管壁,实现对流传热;一旦压力过高,就易造成炉膛闪爆等高危事故。节点3代表出口流量,节点4代表泵的出口流量控制,在此工艺流程中,涉及柴油、氢气等易燃易爆性物质,一旦出口流量过大或其控制失灵,就易引发物质泄漏甚至火灾爆炸等高危事故。节点7代表罐的边界控制,在此工艺流程中,边界控制能够保证罐的温度、压力和液位等处于安全许可范围内,一旦出现过程失控问题,就易导致溢罐等高危事故。由此可见,上述所挖掘的风险薄弱点与实际的柴油加氢装置运行工况相一致,且能够直观化地揭示装置内高风险的单元设备或仪器仪表。

5 结 论

为充分利用工艺报警日志所蕴含的大量风险信息,本工作提出了一种基于报警日志的炼化过程风险薄弱点深度挖掘方法,以揭示复杂炼化生产过程的风险根源,预防高危事故发生。得到以下结论:
(1) 以工艺报警日志为导向,利用Word2Vec词嵌入技术进行向量化预处理,且通过Pearson相关性分析获取邻接矩阵,据此引入CN理论构建风险表征网络。此外,采用TOPSIS对节点重要度进行精确评估,并根据排序优先级,深度挖掘复杂炼化过程的风险薄弱点。
(2) 以某套柴油加氢装置为例,分析结果表明:该风险薄弱点挖掘方法可准确、有效地提取报警等级为“高高报(HH)”或“高报(HI)”的工艺报警日志,即节点3, 4, 7和20,且与柴油加氢装置的实际运行工况相符。
(3) 后续可依据本工作挖掘的风险薄弱点,开展复杂炼化过程风险预测研究,以实时捕捉和跟踪预判高危险性事件。


Deep mining of risk weaknesses for petrochemical processes based on alarm logs

Yingqi ZHU 1,2   Qianlin WANG 1,2    Dongsheng ZHANG 1,2   Zhan DOU 1,2   Jianwen ZHANG 1,2

1. College of Mechanical and Electrical Engineering, Beijing University of Chemical Technology, Beijing 100029, China
2. Interdisciplinary Research Center for Chemical Process Safety, Beijing University of Chemical Technology, Beijing 100029, China 
Abstract: There are highly dangerous factors in the complex petrochemical processes. The raw materials and products have the characteristics of flammable, explosive, toxic, or harmful. The major dangers would be easily caused by a slight carelessness. During the complex petrochemical processes, a great number of potential risk information is contained in the process alarm logs, which is conductive to reveal the root cause of danger incidents and prevent the occurrence of safety accidents. It is important to make full use of alarm logs for the complex petrochemical processes. Therefore, a deep mining method of risk weaknesses for petrochemical processes is proposed based on alarm logs in this work. Firstly, a word embedded technology-Word2Vec is introduced to pre-process the text-type alarm logs and make them to vectorial data, so the text-type alarm logs are converted and quantized. The Pearson correlation coefficient is further applied to analyze the relationship between these alarm logs and obtain the correlation matrix. Secondly, according to the theory of complex networks (CN), the correlation matrix should be transformed into a Boolean matrix, and then the risk character network could be established for complex petrochemical processes. Thirdly, the technique for order preference by similarity to an ideal solution (TOPSIS) is used to accurately assess the node importance of the established network model. This work involves three indicators: degree centrality, proximity centrality, and eigenvector centrality. Finally, the risk weaknesses of petrochemical processes can be deeply mined based on the priority of network node importance. A diesel hydrotreating unit is selected as the test case. Results show that the proposed method can accurately and effectively mine the process alarm logs with the alarm levels of "High High (HH)" and "High (HI)", which is consistent with the actual operating conditions of petrochemical processes.
Keywords: risk weaknesses;alarm logs;node importance;complex networks (CN);technique for order preference by similarity to an ideal solution (TOPSIS)

引用本文: 朱英齐, 王倩琳, 张东胜, 等. 基于报警日志的炼化过程风险薄弱点深度挖掘. 过程工程学报, 2024, 24(3): 371-380. (Zhu Y Q, Wang Q L, Zhang D S, et al. Deep mining of risk weaknesses for petrochemical processes based on alarm logs (in Chinese). Chin. J. Process Eng., 2024, 24(3): 371-380, DOI: 10.12034/j.issn.1009‑606X.223202.)

作者简介:朱英齐,硕士研究生,研究方向为安全科学与工程,E-mail: zyq991006@163.com;

作者简介:王倩琳,讲师/硕导,研究方向为化工过程安全,E-mail: wangqianlin@buct.edu.cn

基金信息: 国家自然科学基金资助项目(编号:52004014);国家重点研发计划项目(编号:2021YFB3301100)

中图分类号: X937

文章编号:1009-606X(2024)03-0371-10

文献标识码: A

收稿日期:2023-07-21

修回日期:2023-10-02

出版日期:2024-03-28

网刊发布日期:2024-04-03



过程工程学报
《过程工程学报》(月刊)创刊于1976年,由中国科学院过程工程研究所主办、科学出版社出版。《过程工程学报》以过程工程科学为学科基础,重点刊登材料、化工、生物、能源、冶金、石油、食品、医药、资源及环境保护等领域中涉及过程工程的原创论文。
 最新文章