本文作者:昆仑数据副总 钟虓
原文刊登于《中国工业和信息化》杂志2024年1月刊 第1期
工业企业在生产制造过程中积累的大量数据,有助于提升生产效率和产品的智能性。但是,由于生产模式和数据的多样性、多源异构性,以及数据质量的不确定性等原因,数据没有得到有效整合,无法有效释放数据价值,并形成持续生产力。这也使得数据要素的管理和运营问题成为了制约工业企业数字化转型的核心因素之一。结合近年来的产业实践,本文尝试从“人-机-料-法-测-环”六个方面对工业数据要素生产管理中的困局和应对之策进行探讨。
自《关于构建更加完善的要素市场化配置体制机制的意见》正式提出将数据列为新型生产要素,很多与数据有关的重要政策文件陆续发布,如《“十四五”数字经济发展规划》《关于构建数据基础制度更好发挥数据要素作用的意见》等。最近,国家数据局在《“数据要素×”三年行动计划(2024—2026)》中将创新研发模式、推动协同制造、提升服务能力、强化区域联动、开发使能技术等作为“数据要素x工业制造”的重点行动。这一系列文件明确,基于数据要素的新业态将成为经济增长的新动力,是产业高质量发展的重要驱动力量。越来越多的工业企业也将数据要素视为企业未来的核心竞争力以及业务增长的动力引擎,将数字化作为“十四五”期间的重点战略方向。
从当前情况来看,工业企业在数据要素方面的既有工作主要围绕两点来开展:一方面,通过技术改造,运用传感器、5G等技术,在生产制造、产品后服务等领域采集了大量数据;另一方面,花重金启动了AI中台、数据中台等大平台系统的建设工作。然而,随着相关工作的开展,工业企业发现数据价值表现往往未如预期,数字化进程通常陷入到以下集中典型困境中:数据基础设施投入大,采集了一堆数据,想用的时候还是无法满足业务需要;相信数据能挖出更深价值,但不知道具体能做点什么,从何开始;做了些“橱窗工程”,但没有对现场产生什么价值;平台建设了不少,甚至已经换了好几个版本,但是如何进行数据价值挖掘仍然面临挑战……在探究问题的根源时,工业企业常将困境归因于数据来源众多、处理复杂,数据量大、存储不易,以及数据标准不足等带来的一致性问题,以及高企的行业门槛带来的分析复杂性等。这些都有其合理性,但好像也不能解释所有问题。数据要素是生产要素的一种,生产要素的管理运营要解决的不仅仅是点上的问题,更需要构建一个完整的体系。有的企业已经认识到这一点,但工业企业长于传统主营业务的体系管理,对于数据要素这类新生事物,无异于跨品类经营,往往感觉无从下手,抓不住重点。那么,工业企业如何理解和构建适合的数据要素管理体系呢?我们可以将企业数据要素管理工作想象为,将工业数据原料通过数据产线,加工成带有业务价值的数据产品的生产过程。那么,我们就可以像分析工业生产过程一样,从“人”“机”“料”“法”“测”“环”等工业企业熟悉的六个维度,对数据要素的生产过程进行分析,从而找到工业企业数据要素体系建设的破局之法。对工业数据要素生产系统中的“人”,直接的理解就是数据要素产线的操作员,负责数据要素的加工和管理。工业企业的数字化工作往往是从数据系统的建设开始,因此在实践中,往往将操作人简单定义为信息化管理人员。然而,在工业数据要素的加工和价值挖掘中,在现场拿到的工业数据往往是不全面且不可靠的。比如,设备故障是小概率事件,大部分设备运行数据都是正常工况;很多异常数据没有被有效标记;单纯依靠算法的“盲挖”,不足以指导工业生产的准确性和可靠性,诸如此类。这导致我们在工业数据处理时需要大量的行业知识,包括机理模型,以及专家经验的补充。因此,一个理想的数据产线操作员,既需要对工业知识、业务场景和价值落地途径足够熟悉,还要掌握机器学习等现代数据的加工分析方法,更要有数据工程化应用的能力,也就是将工业领域知识(OT)、信息化技术(IT)和数据技术(DT)相融合的3T融合能力。当然,这样的全能超人可遇而不可求,对工业企业而言,更务实的做法是培养OT+DT+IT融合的协作团队。将业务专家、数据分析师和数据工程师融入到一个团队,深度结合工业企业自身的产品和生产领域知识,运用数据技术和算法,打造数据产品和服务,显化数据要素价值。在组织中,还有一个不可或缺但容易被忽略的重要角色:行业数据产品经理。他负责定义数据要素价值释放的场景、构架业务闭环方式、评估价值产出和投入,而将具体的技术细节交由团队其他成员实现。这个角色需要对行业数字化业务有深刻理解和洞察,能够根据业务发展对业务模式、数据用户、业务价值、产品体验等业务核心要素进行规划和定义,能带领团队完成数据产品的研发和市场探索及推广。其往往也会是企业数字化业务创新的领军角色。
工业数据要素加工所依赖的“机台”就是数据加工过程中所需的数据采集、存储、管理,以及分析平台与工具。术业有专攻,工业企业通过采购成熟的平台或者工具套件来完成数据要素加工机台的搭建工作,这本身是没有问题的。然而,企业在实践过程中却常面临投入大量资金建好平台之后,发现“不好用”“用不起来”等问题。造成这类问题的原因有很多,其中一个重要原因是没有认识到“没有最好的平台,只有更适合的平台”。首先,从数据属性角度看,不同企业在不同阶段所处理的数据规模、数据类型都是不同的,从研发图纸、文档等非结构化数据,到生产运行管控中产生的时序数据,再到供应链信息等关系型数据,需要选用不同的技术组件进行存储管理。其次,数据“机台”的选择还需充分考虑数据要素的使用方式,存以致用。同样类型的数据因为使用场景和方式的不同,所采用的技术路线也不尽相同。比如,同样是SCADA运行数据,在交互式分析等场景中因为需要数据秒级返回,往往需要内存数据管理技术进行支持。而在设备劣化分析等批量数据使用场景中,需要分布式存储以支持大量数据的并发读取。最后,往往也是被很多工业企业所忽视的,就是“机台”的维护成本。在工业数据产线的搭建过程中,不是使用的组件类型越多越好、越全越好,而是在满足业务需求的前提下,选择尽可能少的后台组件,将后续的维护成本降到最低。由于数据属性的不同、数据使用场景的差异,以及运营维护投入的区别,工业企业所搭建的平台也具备高度的个性差异。在评估一个平台是否足够适合的过程中,企业通常会关注一系列的技术指标,如平台有多大的数据容量、有多少算力、有多少种算法模块等。这些指标固然重要,然而经过多年的实践之后,我们更建议工业企业从两个维度对自己所建的平台进行评估:一个是运用数据解决问题时,从问题提出到数据分析模型建立需要多少时间?这考验的是平台在敏捷创新方面的支撑能力;另一个是从数据分析模型建立,到运用真实数据投入实际生产过程中需要多少时间?这考验的是平台在柔性价值释放方面的支撑能力。这两方面是衡量机台是否“适合”企业的重要维度。
(未完待续,工业数据要素管理中的料、法、测、环敬请期待!)