智能运维利用先进的技术手段,对企业的设备、系统进行实时监测、分析和优化,提高设备的稳定性和可靠性,降低了运维成本。本文从智能运维与信息物理系统、知识图谱、设备精益管理、产品再设计、工业互联网五个方面探讨了智能运维的未来发展。作者:肖雷 张洁,来源:本文引自《智能运维与健康管理》,由「智造苑」原创首发,PLM之神经授权发布。
信息物理系统(cyber-physical system,CPS)是一个集成了信息网络世界和动态物理世界的多维复杂的系统。通过计算、通信和控制的集成和协作,CPS提供实时传感、信息反馈、动态控制等服务。通过紧密连接和反馈循环,物理和计算过程高度相互依赖。通过这种方式,信息世界与物理过程高度集成和实时交互,以便以可靠、安全、协作、稳健和高效的方式监控物理实体。其架构如图1所示。图1 CPS的5C架构
对于能够实现智能互联的复杂产品,尤其是高端智能装备,将实时采集的装备运行过程中的传感器数据传递到其数字孪生模型进行仿真分析,可以对装备的健康状态和故障征兆进行诊断,并进行故障预测;如果产品运行的工况发生改变,对于拟采取的调整措施,可以先对其数字孪生模型在仿真云平台上进行虚拟验证,如果没有问题,再对实际产品的运行参数进行调整。ANSYS的数字孪生技术在风电行业进行应用,通过运用数字孪生技术,可以帮助风电企业避免非计划性停机,实现预测性维护和运行控制与优化。GE航空对于正在空中运行的航空发动机进行实时监控,一旦出现故障隐患,可以通过对数字孪生模型的分析来预测风险等级,及时进行维修维护,显著提升了飞行安全。GE航空通过数字孪生模型记录了每台航空发动机每个架次的飞行路线、承载量,以及不同飞行员的驾驶习惯和对应的油耗,通过分析和优化,可以延长发动机的服役周期,并改进发动机的设计方案。在数字孪生应用领域,GE与ANSYS公司开展了战略合作。通过数字孪生技术的应用,实现产品的健康管理、远程诊断、智能维护和共享服务。通过结合传感器数据和仿真技术,帮助客户分析特定的工作条件并预测故障,从而节约运维成本。GE航空通过汇总设计、制造、运行、完整飞行周期的相关数据,预测航空发动机的性能表现。西门子将来自智能传感器的温度、加速度、压力和电磁场等信号和数据,以及来自数字孪生模型中的多物理场模型和电磁场仿真和温度场仿真结果传递到Mindsphere平台,通过进行对比和评估,来判断产品的可用性、运行绩效和是否需要更换备件。知识图谱用于以符号形式描述物理世界中的概念及其相互关系。其应用服务架构如图2所示。图2 知识图谱应用服务架构
知识图谱在数控机床故障分析的智能运维案例。数控车床是机械产品制造过程中常见的加工设备。由于数控车床具有高质量、高精度的特点,其在产品加工过程占据了很关键的地位。因此很有必要对数控车床中发生和可能发生故障的系统及其组成单元进行分析,鉴别其故障模式、故障原因,估计该故障模式对系统可能产生的何种影响,以便采取措施提高其可靠性。为了高效准确地帮助专家针对数控车床进行故障分析,展示知识图谱技术在机械领域应用的有效性,此处建立了基于知识图谱的故障分析系统。针对故障分析知识图谱的构建过程,从企业设备故障记录文本、以及数控车床设备信息与设备故障相关网页、书籍和文献中抽取到所需的数控车床结构知识、故障模式知识、故障机理知识、故障应对措施知识。最终构建的部分故障分析知识图谱的实体与关系如图3所示。图3 数控车床故障分析知识图谱
(1)灵活的信息查询格式。
(2)故障原因、处理措施推理。
(3)故障影响范围推理。
(4)隐式故障模式推理。
(5)交互式故障检测。
(6)多层次故障分析。
可以看出,基于知识图谱的故障分析彻底改变了传统的故障分析方法,实现了更加全面化、深入化的知识推理,更加高效化、智能化的故障分析,以及更加友好化、个性化的服务应用。精益管理是继大量生产方式之后发展起来的一种效益更高的生产方式。精益管理要求将“精益思维”(lean thinking)理念,以最小资源(包括人力、资金、材料、设备、时间和空间等)投入,创造出更多的价值,同时为顾客提供最新最成熟的产品和优质及时的服务,运用到企业的各项活动中。企业实施精益管理,主要采用现场5S管理、TPM全员维护、精益组织流程管理和ERP管理来解决突出的管理问题。超大规模的轨道交通网络决定了其设施设备专业化维护保障现场具有规模体量大、分布高度离散化、可靠性要求高、管理难度大等特点。在地铁供电设备状态修建设必要性的基础上,重点围绕状态感知、精准施修与检修技术迭代优化3个方面,建设数字化赋能的地铁供电设备“优+”健康状态修系统总体架构;从多源数据中心建设、状态感知模型构建、精准检修决策指引角度,确定数字化赋能的地铁供电设备“优+”健康状态修系统的技术路线。供电分公司从顶层设计开始,通过现场管理的机制建设、质量管理工具应用,植入精益管理思路,提升检修服务质量。公司建立分公司级顶层设计、部门现场级协同联动的高效管理架构,形成集约化管理优势,优化资源配置;通过智能运维平台将生产计划管理、工艺管理、设备管理、质量管理、成本管理和人力资源管理等要素集成融合,形成精益管理合力。在信息化建设方面,公司将智能变电站建设作为提升精益管理执行能力的重要抓手,在分公司层面搭建智能运维系统,在生产现场设置了覆盖生产全链条、全流程的30多万个数据采集点,实现生产全过程的数字化管理,大幅提升了生产管理效率和安全管理水平。运用大数据、云计算、人工智能、工业互联网等先进技术,公司不断优化6S、技术图谱、价值流、制造故障模式及影响分析(PFMECA)等精益管理工具,通过构建数字化赋能的地铁供电设备“优+”健康全要素精益管理模型,推动精益管理从经验驱动向数据驱动转变。在施工作业中,团队面临多种安全风险,如登车安全、行车安全、人车混合作业安全等;一旦发生事故,可能会造成变电设备损坏等危险。为应对现场安全管理风险与挑战,现场在设备维护方面构建了基于顾客可靠性需求的设备维护保障,现场积极探索了一套全新的“优+”全寿命健康度管理体系。一方面,建立了动态、可视的智能辅助评价模型,实时掌握设备状态信息,提升运营设备的可靠性。根据自身特色及需求,将智能运维平台设计为四大体系,24小时全方位地掌握一台设备的状态并提供故障预警的设备实时感知预警体系,从设备投入使用到报废全记录,对设备进行健康度分析并提供维修意见的设备全寿命管理体系,将企、工、人、物4个方面各种流程进行梳理整合,实现了各业务环节信息系统集约、模块间数据联动贯通的“优+”健康度管理。另一方面,运用故障及影响分析(FMEA)模型对关键设备进行预防性识别,明确重大施工、关键工序、关键设备施工过程中的风险。在运用全寿命周期管理的基础之上,引入设备健康度评分的标准,从运营可靠性、生产运营指标、设备状态指标等10个方面进行综合评估健康度,该标准具有较高客观及科学性,从故障设备试验部件更换、负荷影响等维度来进行评价,具有实际意义。通过运用设备健康度评价机制,对老线路1号线1500伏直流开关近30年、11525条检修数据、5000余次故障维修记录的全面性能分析,为关键设备的大修改造提供了可靠依据,成为全国第一个地铁供电智能运维平台基础数据底座。在生产管理方面,公司以快捷、精准满足客户需求为目标,引入国际先进的供电设备和工艺技术,实现均衡化和柔性化生产,实施渐进式大修改造项目管理,划小核算单元,细化改造成本考核。超大规模网络运营阶段突发事件复杂程度增加,对应急响应速度和生产效率的要求更高,基于智能运维的全网络包括生产计划联动的管理,通过智能运维平台,实现了对设备状态实时的展现、故障研判的联动、资源智能的配置、故障精准的维修;通过应用数据采集与监控系统(SCADA),实时监控现场设备运行状态,并自动采集设备运行和环境参数,保障供电正常,依据区域-基地的应急抢修二级结构,并按第一批抢修人员能在最短时间赶到现场响应的原则合理分配现有抢修资源。同时,公司通过设立生产现场看板、准时制(JIT)送发物料看板、智能工器具箱等多系统融合的大数据看板实时展示设备状态等信息数据,实现对运行设备、工艺、物料、质量等要素的全面智能化管控,使得生产全过程透明化、柔性化和可追溯,企业运营管理信息实现及时交互、共享,便于各层级管理人员随时随地掌握所有场景的运营状况,整体提升企业管理水平和运营效率。产品生命周期是指产品从需求分析到产品退役的整个过程,主要包括用户需求、方案设计、技术设计、样机试制、生产制造、产品运维和产品退役。产品生命周期环与设计方法环的关系如图4所示。图4 产品生命周期环与设计方法环的关系
产品运行过程中往往要经历多种工况,不同工况下性能退化程度是不同的。在进行性能退化评估时,对于新输入的性能监测数据,首先确定其所属的工况,然后调用该工况下的性能退化评估模型来评价性能的衰退程度。为了指导产品的设计改进,除了确定性能退化严重的关键功能模块,还需要进一步识别对性能退化敏感的性能监测参数,以进一步找到与这些参数相关的设计参数。通过对关键功能模块的所有性能监测参数数据进行聚类分析,识别出关键性能监测参数,包括功能故障时刻点计算和性能监测参数重要度计算两个步骤。在性能监测参数重要度计算时,首先选取某个关键功能模块,提取与之相关的原始性能监测数据。剔除关键功能模块功能故障时刻点的所有性能监测参数数据样本点,得到一个新的数据集。对新数据集进行聚类,进一步通过计算类数据中心得到与关键功能模块相关的性能监测参数的正常取值范围。将每个功能故障时刻点的数据与正常取值范围进行对比,如果功能故障时刻点的某个性能监测参数的值超出了正常取值范围,则累计一次该性能监测参数的超出次数。统计性能监测参数在功能故障时刻点超出正常取值范围的次数。根据每个性能监测参数累计超出正常取值范围的次数分配每个性能监测参数的重要度。将关键功能模块的所有性能监测参数的重要度按照从大到小的顺序排序,重要度较大的(也就是对性能退化敏感)性能监测参数被定义为关键性能监测参数。关键设计参数指的是设计不合理的产品几何结构或材料参数,是设计的薄弱环节,它导致了产品运行过程中性能的严重退化。因此,找出与退化严重的性能紧密相关的设计参数是识别设计薄弱环节的关键。但在现实中,有些性能参数往往无法直接检测到,只能通过若干个性能监测参数(即传感器采集到的数据)来间接计算或表征。这样,可以依据性能监测参数与性能参数之间的关联关系,由关键监测参数找到退化严重的性能参数,即关键性能参数。此外,产品性能是由设计参数决定的,每个性能参数与若干个设计参数相关。因此,可以依据性能参数与设计参数之间的关联关系,由关键性能参数找到关键设计参数。也就是建立如图5所示的“性能监测参数—性能参数—设计参数”两级关联矩阵,通过两级转换完成从关键监测参数到关键设计参数的映射,实现关键设计参数的识别。图5 “性能监测参数-性能参数--设计参数”两级关联关系矩阵
(1)需要实现将不同来源和不同结构的数据进行广泛采集;
(2)需要具备并支撑海量工业数据处理的环境;
(3)需要基于工业机理和数据科学实现海量数据的深度分析,并实现工业知识的沉淀和复用;
(4)能够提供开发工具及环境,实现工业APP的开发、测试和部署。
工业互联网的本质是通过开放的、全球化的工业级网络平台把设备、生产线、工厂、供应商、产品和客户紧密地连接和融合起来,高效共享工业经济中的各种要素资源,从而通过自动化、智能化的生产方式降低成本、增加效率,帮助制造业延长产业链,推动制造业转型发展。工业互联网包括网络、平台、安全3大体系,工业互联网平台从技术形态上,分为边缘层(数据采集)、IaaS层(云基础设施)、PaaS层(管理服务平台)和SaaS层(工业 APP/ 软件)4大层级。从德国的“工业4.0”到中国的“智能制造”,再到美国的“工业互联网”,这些战略的提出和施行都意味着各国对工业物联网的高度重视。而作为工业物联网的“杀手级”应用,预测性维护得到市场重视,进一步推进了制造业发展向智能化新模式的转变。现如今有众多工业互联网平台中已经包含了智能运维的部分功能,例如由GE公司推出的Predix平台,西门子公司的MindSphere云平台,徐工集团推出的Xrea平台,三一重工集团推出的工业大数据平台。