数据资产运营建设专题二:数据盘点

文摘   2024-11-18 15:00   江苏  

1.盘点数据资产绘制数据资产全貌,实现数据可看

提升数据资产运营水平的前提是知晓资产状况,即“盘清数据”。在明确盘点范围的基础上,构建数据资产目录,盘点资产内容、存储和管理情况,并通过可视化手段,支持各类用户快捷高效的查询和使用。数据资产盘点工作不仅回答了数据“有什么、在哪里、怎么用”的问题,还在盘点过程中,确保各方对数据内容、权利和责任的理解达成一致,实现数据可看、可理解。

2.“盘”清资产,道阻且长

数据资产盘点面临三方面难点:一是数据体量巨大。企业系统复杂,数据源众多且多样化,数据量极大,盘点过程容易失去章法,陷入局部细节而无法兼顾全局。二是数据关系复杂。业务数据存在多层级的主次关系、聚合关系、参考关系、因果关系,导致盘点无处下手,难以推进。三是数据迭代迅速。随着业务形态的变化,信息系统也在快速迭代、流程管理不断优化,对盘点结果有很高的时效性与运营能力要求。

3.识別数据资产形态,厘清数据资产类型

数据资产的识别是数据资产盘点的前提,需要从茫茫的数据海洋中,将最具价值的数据资产识别出来。HiNA认为,只有由企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源才是数据资产,如文件资料、电子数据等。同时数据资产类型多样,包括结构化数据、非结构化数据,又有内部数据和外部数据,同时还有企业经过梳理和开发的数据模型、数据标准等规范、以及标签、指标、数据集、数据挖掘模型等衍生资产。不同的资产类型具有不同的资产描述属性,因此需要识别数据资产形态,厘清企业数据资产类型。HiNA建议将数据资产划分为基础类、规范类、集成类、服务类这四类,以便能更体系化、科学化的盘点、管理和使用数据资产。

・基础类:主要是业务系统和企业数据库中的明细数据,包含结构化数据(内部数据、外部数据)和非结构化数据(图片、音频、视频、文本、邮件、网页)。

・规范类:企业梳理和制定的数据类规范文件,包含数据标准(指标数据标准、基础数据标准)、数据模型(概念模型、逻辑模型、物理模型、逻辑模型与物理模型映射)、业务术语、政策与规则、数据安全分级信息、数据质量规则、数据字典、关键数据项(KDE)等。

・集成类:经过汇聚、整合及加工过的数据,主要是数据整合与储存(数据湖数据、数据仓库数据、数据中台数据)、数据集市数据(财务、风险、监管报送、合规审计等)。

・服务类:从应用场景出发,按照业务需求进行加工和建模后的数据,包含指标数据、标签、特征工程、也包含数据集、固定报表、主题分析以及之间的映射关系,还包括经过挖掘或算法建模的数据模型应用、规则库、知识图谱以及封装后的数据API等。

4.体系化、科学化的盘点方法和流程

数据资产盘点重要且难度大,需要一套体系化、科学化的数据资产盘点方法。企业数据资产盘点覆盖全域,因此需要全员参与,协同工作。数据资产盘点以挖掘资产价值、驱动业务发展为导向。先确定盘点范围,如盘点的组织范围、业务范围、系统范围。随后根据已经确定的盘点范围,组织盘点人员确定规范并启动盘点,将整理的数据资产清单与设计的数据资产目录进行融合,完成数据资产初步梳理。最后,做好盘点成果的优化、管理维护工作,并发布到数据资产平台上支持使用。

数据资产目录设计是盘清资产的核心,数据资产目录将企业内所有数据进行汇总,构建一张全局数据地图,清晰展现出企业拥有的数据内容、数据量、数据价值、数据存储位置以及数据归属和责任人。数据资产目录设计可以业务视角为核心,目录分类主题便于业务人员理解和使用,兼顾技术视角,指导数据架构及开发的实施落地,同时需关注目录的可维护性和可拓展性。除此之外,还可以考虑多样化用数场景,建设业务框架、基础IT框架、数据管理框架、数据应用框架等多种数据资产目录分类框架。

盘点结果形成的数据资产卡片,是数据资产相关信息的真实表达,包含数据资产生产、流动、加工和使用各环节中可能会使用到的信息。支持数据资产的业务属性、技术属性、运营属性、特色属性查询,同时还可进行灵活定义和拓展,如血缘视图、资源视图、业务视图、数据资产关系视图等。实现资产的链路解析及归因分析,形成全域数据“大百科全书”,最后可结合应用场景,开展可视化设计,构建数据资产视图,支撑数据资产的个性化访问。

5.数据资产盘点的发展态势

数据资产盘点正在朝着以下三个方向发展:一是智能化,随着人工智能技术的发展和普及,数据资产盘点将摆脱手工的人力盘点方式,多采用智能化的工具支持,提高盘点的效率和准确性。二是全面化,除关注企业内部数据资产盘点外,还涵盖更多外部数据资产,以及物联网、数据产品上架、公开数据集等数据生态圈资产。三是精细化,随着企业对数据资产管理的要求越来越高,数据资产盘点将更加精细化,对每一种类型的数据资产都要有不同的管理策略和方法,除了描述资产的内容还对资产的敏感性、分级分类和数据安全策略进行说明等。




左上角“海纳数智研究院”,感谢您的关注!

海纳数智研究院
专注于数据资产相关的行业动态。致力于数据安全、数据治理、数据培训、数据评估、数据入表、数据交易各环节实操;帮助企业实现从“数据”到“资产”再到“资本”的价值转化。
 最新文章