如果说《工业大数据分析实践》着眼于数据分析的“课题定义、业务理解”、《工业大数据算法实战》旨在帮助工业背景的数据分析师构建“算法建模”能力,那么《工业大数据工程 系统、方法与实践》全面覆盖了数据平台、数据分析和数据应用3大数据工程要素,期望通过一系列工程方法与系统技术,提高工业大数据的技术建设与价值创造速度。
01
为什么要出版这本书?
工业数字化不是单纯的采数据、建平台,而是需要工业企业基于数据做长期持续的改善、优化和创新。数据工程是数据价值的持续释放的关键保障,由数据平台、数据分析、数据应用这3大数据工程要素构成。本书讨论了工业数据工程的关键技术与指导方法。
02
这本书涵盖了哪些内容?
本书侧重于敏捷工业大数据工程方法和面向领域的工业大数据系统技术,这两方面统称为工业大数据工程。全书一共10章。第1章讨论了工业大数据的内涵与特点,并给出了工业大数据工程的三个要素,即数据资源、数据分析和数据应用;第2~4章提出了领域模型驱动的数据资源的建模技术,并给出了工业大数据系统技术与建设方法;第5、6章讨论了敏捷工业大数据分析与运维方法,并阐述了背后的分析软件技术;第7章讨论了用户驱动数据应用的低代码开发技术;第8~10章用风电、水电、煤矿综采三个行业,展示了工业大数据工程方法的应用过程。
03
有哪些值得一读的工程方法?
本书提出了数据创新产线、价值产线的数据工厂理念,包括4大类方法。
• 领域驱动的数据建模方法:将多源异构数据按照工业语义有序组织,以及模型驱动的存储与查询优化技术,实现数据的资源化管理;
• STEP-DO数据系统规划方法:工业数据接入方式、存储结构、计算引擎和监控管理提供了选型与建设指导方法,构建数据资源的长效运行架构;
• 基于MLOPS的敏捷数据分析方法:CRISP-DM的每个阶段的细化指导方法,包括基于业务用例分解的业务场景识别方法、系统动力学辅助的业务理解方法、基于领域模型的数据理解与质量审查方法、数据准备与模型构建的典型模式与技巧、模型评价方法、基于增量状态的模型部署逻辑审查方法等,加速数据资源的价值提升过程;
• 智能应用的敏捷开发方法:将数据分析快速变成数据应用的过程方法与低代码开发技术,以及云边端一体化运行环境技术,加速数据资源的价值落地过程。
04
本书适合哪些读者?
值得工业企业数字化业务/信息化部/研发部的管理与技术人员、工业互联网与工业大数据企业的技术与实施人员(数据工程师/数据分析师/数据应用开发工程师)、大数据系统的教育与研究人员、对工业数字化转型有研究/策划需求的相关从业人员阅读,也可作为上述人员的培训教材和相关专业师生的参考书。
05
以下是福利
在文末留言区写下您对工业大数据行业、对昆仑数据、对本书或是对田博的期待,精选5条粉丝留言送出签名书,快快关注留言吧~