实施数据治理能够显著提升企业的数据管理效能,保障数据的准确性和完整性,并推动形成开放与共享的数据环境。中国通信标准化协会(CCSA)于 2021年12月发布的《数据治理标准化白皮书》强调了数据治理的重要性。数据治理是一个系统化的框架,是决策制定与操作执行的合作,要求治理主体对数据资产负起全面责任。但企业中缺乏数据治理以及不知如何进行数据治理的现象依然大量存在。选择一个高效的数据治理模型,可以为企业提供明确的指导原则和行动路线,从而确保数据治理工作的有序进行和高效实施。
数据治理模型是达成数据治理目标的关键基础,同时,数据治理模型的可操作性和实践意义也需要关注。尽管许多治理模型具有适应性和可扩展性,但是企业的独特性以及数据治理过程的动态性不能忽略。不同的企业拥有不同的战略目标、业务需求、资源能力及组织结构,需要不同的数据治理模型指导企业数据治理的实施。DCMM、DAMA、DGI 这3个数据治理模型因为具有全面性和系统性,被广泛借鉴和使用。本文考虑到企业的不同性,结合3个数据治理模型治理目标、治理特点及优缺点的分析比较结果,旨在为企业选择数据治理模型提供建议。
数据治理模型能为数据治理的实施提供理论支撑和指导。运用系统比较分析方法对 DCMM、DAMA、DGI这3个数据治理模型进行比较分析,为我国企业数据治理进步提供更详尽的建议和更清晰的发展规划。
本研究包括以下几个部分:首先,介绍这3个国内外数据治理模型的相关背景。其次,对3种数据治理模型框架进行比较分析。然后,结合治理所面临的问题和数据治理模型框架的比较分析,为我国企业数据治理模型选择提供建议。最后,对本研究的不足之处和进一步的研究进行总结。
一、3个模型的相关背景介绍
DCMM 是由全国信息技术标准化技术委员会于2014 年启动,并于 2018 年 4 月成为国家标准《数据管理能力成熟度评估模型 GB/T 36073-2018》,由评价维度(功能域)、功能子域和成熟度等级构成,是一个针对企业数据管理和应用能力的评估框架。DCMM模型宏观层面的评价标准是从整体上设置每个成熟度级别的评价标准,而微观层面的评价则对每个大类及其子类的每个成熟度级别都给出相应评价的标准。
该模型定义了数据战略、数据治理、数据架构、数据应用、数据安全、数据质量、数据标准和数据生存周期8个核心能力域,从战略层面到具体的执行层面,将数据管理细分为28个过程域和445条能力等级标准,涵盖了数据管理的各个方面。其中数据治理作为DCMM中的一个核心能力域,是企业数据管理能力成熟度的重要组成部分,它涉及数据的整个生命周期管理,包括数据的规划、获取、维护、使用和退役等各个阶段。通过有效的数据治理,企业可以提高数据的可用性、一致性和安全性,从而支持企业的业务发展和竞争优势。
国际数据管理协会(DAMA)致力于数据管理的研究、实践和推广,涉及从数据治理的规划、实施到监督和持续改进的全过程。DAMA数据管理框架是其提出的一套全面的数据管理知识体系。DAMA 数据治理模型由两个子模型构成,包括围绕数据治理开展的11个数据管理职能领域与7个基本环境要素。该模型的核心意义在于,通过7个环境元素对每个职能进行描述,构建以数据为中心的数据治理组织,解决数据管理功能与环境要素之间的平衡匹配问题。
其中,11个数据管理职能包含数据治理、数据架构、数据建模和设计、数据存储和操作、数据安全、数据集成和互操作性、文档和内容管理、参考数据和主数据管理、数据仓库和商务职能、元数据管理和数据质量管理。7个环境要素包括目标与原则、组织与文化、工具、活动、角色与职责、交付成果、技术。DAMA数据治理模型的治理结构包括一系列的关键组成部分,如数据治理委员会、数据所有者、数据质量专员等角色与职责。通过 DAMA数据治理模型可以帮助企业建立和维护有效的数据管理体系,有效地管理其数据资产,便于企业更好地利用数据资产,以支持业务的目标和战略,支持业务的发展和创新。
DGI数据治理框架是由国际数据治理研究所提出的一个数据治理理论体系,它将数据治理视为业务的,是价值驱动型数据治理框架,用于企业在进行业务办理以及战略决策时对数据资产进行治理的复杂活动。DGI数据治理模型的治理结构包括10个核心组件,涵盖数据治理愿景使命、数据治理目标、数据规则与定义、数据的决策权、数据问责制、数据管控、数据利益相关方、数据治理办公室、数据管理小组和数据治理流程,确保了数据治理活动的有效性和连贯性这些组件构成了一个全面的数据治理框架,。将数据治理的关键要素分为三大类:规则与协同工作规范、人员与组织结构、流程。这种分类方式直观地展示了10个基本组件之间的逻辑关系,形成一个从理论到实践的完整系统,将治理流程融入模型之中,以流程箭头的形式标识治理顺序。DGI数据治理模型的优势是条理清晰、重点突出,回归了研究问题的本质,回答了 5W问题(WHY、WHAT、WHO、WHEN、HOW)。在组织变得庞大以及数据系统变得复杂,模式无法解决现有的数据相关活动的假设背景下导致传统的数据管理,DGI数据治理框架可以解决组织在规模和复杂性上增长变化时对数据治理实践的影响和需求。
二、比较分析
3个数据治理模型都是遵循数据治理的原则与目标而进行构建的,通过创建标准化、可重复的治理过程帮助企业进行更好的决策制定,降低成本提高效率,减少数据运营上的冲突,满足数据利益相关方的需求,确保治理过程的透明化。3个数据治理模型都提供了一套结构化的方法处理数据管理问题,但都具有各自数据管理的侧重点。需要注意的是,DCMM、DAMA、DGI这3个数据治理模型虽然适应性强,具有可扩展性与全面性,逻辑清晰,可以满足大部分企业的数据治理需求,但各企业的数据管理需求不同,通用模型无法完全适配各个企业的数据治理。因此,对这3个数据治理模型进行比较分析,试图找出更贴切各个企业的数据治理模型。比较分析结果如表1所示。
数据被视为企业的重要资产,需要得到妥善管理和保护,为了确保数据的有效治理,必须立一套完整的治理结构和流程。这3个数据治理模型都是为实现企业的战略目标及数据资产化而建立的,但这3个模型数据治理的重点却不相同。DCMM是一个评估和改进组织数据管理能力的工具,提供了一套标准和评估方法,用于指导组织如何管理其数据资产,帮助组织识别其数据管理的成熟度水平,并指导如何逐步提升到更高的成熟度等级,从而达到帮助建立一个更加成熟和有效的数据治理体系的目的。DAMA是围绕数据治理开展的确保数据得到恰当管理的数据管理模型,通过定义数据管理职能、制定专业管理术语,对数据管理全貌建立整体的概念,以此来指导企业数据治理工作的实施。DGI数据治理框架则是依据高层战略和政策进行设计,通过优化人员和资源配置达成组织的数据管理目标,从3个关键维度——责任主体(Who)、相关制度与政策(What)以及技术解决方案(How),选择与组织各评价指标相匹配的要素。它以业务价值为导向,由数据治理的10个通用组件构成,具有固有序列,是可重复标注化的数据治理过程,企业可以在已有的治理项目中加入DGI数据治理框架。
表1 3种数据治理模型比较分析
三、企业选择数据治理模型的指导建议
随着信息技术的迅猛进步,中国现已步入一个数据急剧增长的新时代。根据中国政府网的报道,2023年我国数据生产总量预计超过32 ZB,个人日常生活的点滴记录、企业的供应链信息、政府的人口和就业统计等各个方面的数据汇聚成了经济社会运行中的重要资源。这些数据资源涵盖了文本、图片、视频、音频等多种形式。同时,数据来源也非常广泛,包括社交媒体、电子商务、物联网设备等。这种海量性、多样性的数据给各企业带来了使用价值,促进了社会的发展,但同时也带来了数据治理的挑战。
3.1 企业的需求与策略
不同的企业适合什么类型的数据治理方案,与企业本身的侧重点和价值定位息息相关。为确保数据治理的实现,需要满足利益相关方增加利润的需求,管控治理成本与复杂性以及为保证企业的正常运营而时刻关注数据治理的风险、合规、脆弱性等方面。因此,企业在选择数据治理模型时,通常会根据自身的需求、文化背景和组织结构,选择一个最适合其特定需求和条件的数据治理模型,以实现有效的数据管理和利用。
对于数据治理,首先企业应明确数据治理的目标和战略,确保所选模型与企业的长期战略相符合;其次,还要从企业各方面情况进行综合考虑,如企业规模和业务复杂性、企业的资源和预算、企业自身的数据管理和技术能力、企业现有的技术基础设施和平台兼容性以及企业现有的数据治理的成熟度等。大型企业数据资源庞大,治理预算充足,自身在数据存储、处理、分析等方面有一定的能力,数据治理的成熟度较高,需要一个更为复杂和全面的、能够匹配或提升这些能力的模型,以涵盖广泛的业务流程和数据类型。而中小型企业需要优先注重治理成本效益,同时避免过度的复杂性和管理负担,确保在有限的资源下实现最大的治理效果,可能更适合采用较为简化的模型。但是,数据治理不应只有一个侧重点,企业可以根据自身情况和需求,结合使用这些框架,以达到最佳的数据治理效果。
3.2 DCMM数据管理能力成熟度评估模型
在数据管理的研究热潮中,数据管理服务趋于常态化,但是对于数据管理服务能力的评估仍是研究洼地之一,而构建一套模型与方法帮助企业识别与评价其数据管理服务能力,进而实现服务能力的管理、改进和提高,具有重要的时代意义与需求。DCMM 是我国出台的首个数据管理能力评估模型,适用于组织和机构对自身数据管理能力成熟度进行评估。DCMM将数据管理能力分为5个等级,通过企业已覆盖的能力域进行数据管理能力评估,覆盖越多,成熟度等级越高,可以对企业进行整体的量化评估。而DAMA只包含监控和指导政策合规性、数据使用和管理活动,没有明确的治理水平量化评估,DGI数据治理流程中只包含数据治理的监控、评估和报告,因此两者只可对企业数据管理能力进行局部性的定性评估。
数据拥有方企业,如互联网公司、金融机构、保险公司以及电信公司等,掌握着庞大的数据资源,可以通过DCMM进行企业数据管理能力成熟度自评,并通过DCMM的数据管理标准进行本企业的数据治理。而企业数据解决方案提供方(提供产品和服务),如信息系统构建者、服务提供者及软件开发和运营企业,可以通过DCMM完善企业数据管理方案的全面性和成熟度,以此来提升自身的咨询及业务实施能力,也可以以DCMM 作为数据治理的标准,指导需求方企业的数据治理。DCMM 作为我国的数据管理标准,意味着它在设计时充分考虑了国内的法律法规、行业特点和数据管理实际情况,更符合中国企业的需求和环境,而且不同地方政府对于通过DCMM评估的企业给予不同程度的资金支持和奖励,这为我国本土企业进行数据管理能力建设提供了额外的动力。通过 DCMM 评估的企业,可以获取专业认证,成为行业标杆,是项目招投标的加分项。因此,参与省部级及国家级的大型工程招标项目、试点项目,以及有对外服务业务的企业,获取DCMM评估证书后在承接项目方面可以获取更多的优势。
3.3 DAMA数据管理框架
DAMA 提供了一套非常详尽的理论框架,包括数据治理的原则、角色、职责和最佳实践,这种详尽性使得DAMA 成为一个全面的参考模型,适用于各种规模和类型的组织。此外,DAMA 还拥有国际认可的专业认证体系,如 CDMP(Certified Data Management Profes⁃sional)和 CDGA(Certified Data Governance Associate),这些认证有助于提升数据管理专业人员的专业知识和技能。DAMA 中提出了关于参考数据与主数据管理,是数据资产管理的核心,这适用于有复杂流程和多个业务系统共同办公的企业,需要MDM、RDM来保障数据的一致性、准确性和可维护性,以确保跨部门的数据协同共享。跨国企业面临不同国家和地区的数据管理挑战,DAMA模型建立了数据管理的通用词汇表,它的国际性质使其成为这些跨国企业在全球范围内统一数据治理实践的理想选择。DAMA数据治理模型还适合于需要遵守严格的数据管理法规和标准的高度规范化行业,如金融、医疗等对数据管理严格要求的企业,因为DAMA模型提出了数据治理监控和指导的合规性要求,并且非常注重数据质量以及数据安全的治理,可以为这些企业提供一套成熟的治理原则和实践,帮助企业满足合规要求。
3.4 DGI数据治理框架
DGI框架提供了关于数据治理结构、目标设定、流程优化等方面的指导性建议,旨在降低数据管理的成本和复杂性,具有很强的实操性。DGI框架提出的问责制,明确了数据治理职责和分工定位,精确到了每个部门每个人所负责的部分。对于数据可审计和数据透明度有要求的企业及政府部门,利用 DGI 框架进行数据治理,可以提高工作人员的责任归属,在数据出现问题时,问责制可以帮助快速定位问题源头和责任人,还可以提高企业的信任度。含有大量客户数据的企业,对数据安全性要求高,DGI数据治理框架中提出的数据风险管理,可以防范企业数据被滥用、泄露、被篡改等风险,确保企业数据的安全性。DGI数据治理框架还适用于那些在运营和决策过程中高度依赖数据的收集、处理、分析和利用,将数据视为核心资产并依赖数据推动决策和创新的数据密集型企业,因为 DGI 框架倡导制定数据治理计划时,首先聚焦于在界定清晰的问题时,逐一解决并实现既定目标后再扩大范围,这种迭代的过程有助于企业逐步建立和完善数据治理体系。
有些企业因自身的性质及需求,单一的数据治理模型并不能满足其治理现状,这时可以结合不同数据治理模型中的侧重点进行该企业的数据治理。比如:DAMA和DGI数据治理模型在企业数据管理能力成熟度评估上并不完善,未设置专门的数据管理能力评估标准。在这种情况下,可以将 DAMA 或者 DGI 数据治理模型作为主体模型,结合DCMM数据管理能力成熟度模型进行企业的数据治理。DGI数据治理框架运用数据治理的十大通用组件是一个灵活的模型,可以根据企业的特定需求和情况来调整和应用,它不仅可以应用于数据治理项目的初始阶段,而且可以在项目的任何阶段加入,可以在已有的企业数据治理项目中加入,但是其缺乏对主数据和参考数据的管理,这关系到不同部门之间进行数据共享的效率。因此,将 DGI 数据治理框架作为企业数据治理的主体,结合DAMA 数据治理模型进行企业的数据治理,可以弥补 DGI 数据治理框架对主数据和参考数据管理的不足。
4 结语
数据治理模型不是终点与目的,治理也只是为了提升机构竞争力与核心价值,而更好地把控数据质量,提升数据利用价值,才是其最终目的。但是,一个好的数据治理模型能够帮助企业理清复杂模糊的概念,明确治理目标与行动计划,提高效率与成功率。因此,数据治理模型的建立是未来研究的重点方向。