(1)对大数据治理管理的总体认知
- 数据资源的重要性:数据作为企业的核心资产,具有高度的价值,但这种价值需要通过一系列的治理过程才能转化为可使用的数据资产。
- 数据治理的目标:数据治理旨在将数据从原始状态转化为结构化、流程化、标准化的形式,以便更好地被企业所利用,进而产生实际的经济效益。
- 数据治理的驱动因素:企业进行数据治理的最大驱动力来自于数据的应用价值,数据治理管理是企业战略的重要组成部分,需要企业投资来驱动。
- 数据治理的核心要素:数据治理的成功实施依赖于组织、制度、规范、开发与工具等核心要素的共同作用。
(3)企业大数据治理的核心理念与方法
- 基于“三资模型”构建大数据治理体系:通过数据治理、数据标准和规范、平台和工具支持等维度,构建完整的大数据治理体系,确保数据资源的有效管理和利用。
- 数据产品工厂体系:借鉴工厂化生产模式,构建基于产线设计的数据产品工厂体系,实现数据治理的标准化、流程化和自动化。
- 体系化运营:构建一个能持续高效运转的组织数据治理运营体系,确保数据治理工作的长期有效进行。
(4)当前组织在数据治理方面存在的普遍问题
- 数据分散割裂:数据以域、系统为单位“烟囱”式分布,无横向关联,造成数据壁垒。
- 数据标准不统一:未形成企业级数据治理体系和整合机制,没有定义企业统一标准数据字典。
- 数据敏捷开发能力不足:数据开发需要大量数据开发人员写脚本,无法实现自动化数据任务的统一编排和调度。
- 数据质量问题:各业务系统中表的数量多、相似表数量过多、无效表过多,无法保障数据的可用性。
- 数据全局视图缺失:数据资产无法集中管理和展现,共享性差,无法实现数据开放共享运营分析能力。
- 数据安全隐患:数据权限划分不清、敏感数据得不到监控等情况都是潜在的数据安全隐患。
- 管理角色分工不明:权责不明、管理角色分工不清,对于已然形成的大量数据,找不到接口人。
(5)对数据治理所面临根本挑战的理解
- 复杂性叠加规模化:数据治理需要在高应用标准的要求下面对复杂性叠加规模化的挑战,包括异构数据多样规则、数据处理计算复杂、应用场景模型构建算法探究等。
- 强需求与高标准:企业需要快速响应业务需求,提供高性能、良好体验的数据服务,同时确保数据的安全保障。
(6)对数据治理挑战的应对之道
- 构建基于产线设计的数据产品工厂体系:通过标准化(产品&工艺)、流水线(产线组装&弹性生产)、体系化(规范与精益管理)、自动化(机器生产)等方式,实现数据治理的高效化生产和产品化交付。
(7)企业数据治理总体解决方案
- 数据工厂概念:提出数据工厂的概念,通过共享数据产线、共享基础库/公共主题数据等方式,实现数据的粗加工和精加工,最终交付各类数据产品。
- 统一管控体系:建立统一的数据标准、模型标准、质量保障和开发标准,确保数据治理工作的规范性和有效性。
(8)企业数据治理实施通用流图
- 数据归集与分发:通过数据前置库、大数据资源中心等方式,实现数据的归集、清洗、加工和分发,支持内部业务数据、内部各类文件、内部物联数据、外部数据等多种数据源。
- 数据产线与数据产品:通过数据产线实现数据的加工处理,最终形成各类数据产品,满足内部管理者、内部业务部门、兄弟单位、合作伙伴等不同消费群体的需求。
(9)数据治理的关键是体系化的运营
- 构建持续高效运转的组织:建立一个能持续高效运转的组织数据治理运营体系,始终以数据服务业务为目标,持续建设高价值的数据资产与服务。
- 实施原则:平台建设先行、长期治理运营、1+N运营模式(即统一数据平台支持多个治理运营组)、平台建设与治理运营团队相独立等。
(10)大数据治理平台建设项目实施方案
- 建设目标:构建一个能持续高效运转的大数据治理与应用运营体系。
- 实施步骤:包括建设大数据治理能力平台、制定企业大数据治理技术与管理流程规范、汇聚业务数据建设大数据资源中心数据湖、构建主数据、报表中心等基础数据应用、建设智能营销风险预警等创新类数据应用等。
- 实施原则:统一目标、整体规划、构建体系、集约建设、共享共治、持续运营等。
第二章:企业数据治理平台设计方案
(1)概述
- 设计理念:企业大数据治理平台以为组织打造通用的数据工厂为设计理念,以构建流水式数据产线为核心,为组织构建一个可持续、高效将“数据原料”加工为“数据产品”的数据治理体系。
- 数据产品与服务:通过数据治理平台,将各类业务数据、日志数据、视频数据、物联数据等转化为数据产品,并通过数据产品服务门户提供给内部管理者、内部业务部门、兄弟单位、合作伙伴等消费群体。
(2)设计理念
- 数据模型标准化:通过治理平台将数据模型的要求严格落地,杜绝不满足标准的数据模型出现在系统中。
- 数据运营全员化:体现“平台化、开放性”的思想,提高数据开放的可视化,实现人人参与数据治理、数据建设和数据运维。
- 数据安全可控化:体现安全的重要性、必要性,保障系统数据安全和数据服务开放过程中数据的安全可控。
- 数据治理产品化:将数据治理的成果和内容,以产品的方式来进行封装与交付,构建“场景-需求-产品”的数据治理运营模式。
- 数据处理工厂化:对数据的处理、融合开发等工作,必须实现工厂化建设和管理,以“极速、低成本、高质量”要求来响应业务部门的个性化数据需求。
(3)设计思路
- 以元数据为核心驱动全链路数据治理活动:通过全生命周期元数据管控体系,实现数据的清洗、融合、标准、质量、资产、共享等全链路治理活动。
(4)设计蓝图
- 产线设计与运行:通过产线设计、产线搭建、产线运行等步骤,实现数据原料的加载、数据质量稽核、元数据&数据标准规范等处理流程,最终形成数据产品并交付给消费者。
(5)总体架构
- 基础平台:包括数据源管理、数据采集、插件管理、数据管理基础平台等组件,为数据治理平台提供基础的技术支持。
- 大数据管理与治理:包括大数据管理、大数据治理、元数据管理、数据工厂、数据质量管控、数据共享服务等模块,实现数据的高效治理和利用。
- 应用能力:提供金融、零售、制造业、交通、农业等行业应用方案,满足不同行业的数据治理需求。
- 用户角色:支持数据开发人员、数据分析师、业务用户、数据科学家、数据管理员、数据操作员等多种用户角色,实现数据的全员参与和治理。
(6)特性分析
- 兼容市面各类常用数据库:与传统国外关系型数据库及开源hadoop,华为、阿里、星环、达梦等数据底座均实现了适配,支持快速适配多种数据源端的元数据与数据采集。
- 前置、自动、端到端与智能的元数据管理:提供元数据前向获取功能,支持自动采集、变更监控等智能应用,实现元数据的全流程管理和监控。
- 多维、全过程的数据标准管控:支持多元数据标准的制定及数据标准的统一管控,确保数据在生命周期的各阶段始终满足组织的技术与业务规范。
- 基于模板的可视化数据产线开发:提供大量数据处理与开发能力组件/程序,支持自定义数据加工工序与产线模板,实现数据的可视化程序编排和高效开发。
- 灵活、高效、统一的任务调度管理:通过统一开发调度平台实现多个工厂、多条生产线的协同调度,确保数据治理工作的按时完成。
- 基于场景的全过程数据质量管控:支持对数据质量的九大维度进行管控,并提供质量稽核方案、质量规则配置等功能,确保数据质量持续提升。
- 规范、完整的数据资产管理:提供数据资产目录管理、资产生命周期管理、资产发布管理等功能,支持数据的精准检索、多维统计和可视化呈现。
- 严密、可靠的安全保障:提供基础设备信息、身份认证信息、数据授权信息、信息安全服务信息等全方位的安全保障体系,确保数据治理平台的安全性和可靠性。
延伸阅读>>
321页PPT|整车巨头IT规划方法论与实践案例详解(续):集团数据规划、集团IT集成架构、集团T基础设施规划、IT治理体系规划
243页PPT|集团财务管控平台全景建设方案与案例分享:报表管理、全业务报账、大数据、全面预算管理、紫金矿业、中国铝业、上海电气
219页PPT|科技巨头高效供应链管理方案:从供应端至流通端全协同设计、全景支撑产品研发、零件定点、生产准备、生产制造、售后服务
134PPT|SAP|白酒巨头数字化战略规划:市场、研发、计划、采供、生产、物流、销售、客户服务:APS、MES、CRM集成支持
166页PPT | 化工集团企业4A架构详细设计方案:业务架构设计、应用架构设计、数据架构设计、技术架构设计及信息化管控体系设计
👇🏻点击「阅读原文」,更多好文,任意下载