设立专管机构,完善管理体系,解决信息烟囱问题。
整合数据孤岛,统一数据标准,解决数据分散和利益割据问题。
构建数据采集体系,打通数据整合通道,解决数据保密和不全面问题。
设计数据存储策略,提升数据存储效率,解决安全保障不健全和管理机制不成体系问题。
初步构建数据治理体系,解决数据标准不统一问题。
制定数据共享服务策略,促进数据融合安全发展。
奠定数据应用基础,打造大数据综合应用能力,推进数字化转型发展。
数据湖平台框架体系规划:
确定数据湖的总体框架,包括数据架构、技术架构、应用体系、数据治理、数据共享等。
规划数据湖的建设蓝图,包括短期和长期目标,以及如何逐步实现这些目标。
逻辑架构:
搭建基础平台,以集团C端用户需求为试点打通数据湖链路,确保数据源、采集、汇聚、治理、分析和共享服务的逻辑一致性和流程顺畅。
设计数据流程,从数据源到数据应用的每个步骤,确保数据的质量和可用性。
数据架构:
定义数据湖的数据架构,包括数据源、采集、汇聚、治理、分析和共享服务等环节。
确保数据架构能够支持集团的业务需求,并且具有可扩展性和灵活性。
数据资源中心建设:
建设数据资源中心,包括基础数据区、主题/分析数据区和集市区,以存储和管理数据。
实施数据模型设计,包括行业模型选择、概念模型、逻辑数据模型和物理数据模型。
进行信息调研,持续迭代完善数据资源中心的建设。
设计用户标签和数据模型,构建用户360画像,以便更好地理解和服务用户。
三、数据治理与数据共享服务试点应用
3.1 数据治理建设
数据标准管理:
为实体及属性、统计指标、层级化实体、国家或行业标准代码等设置标准。
管理业务术语和命名规范,确保数据的一致性和准确性。
元数据管理:
采集和维护元数据,包括系统、表与字段的血缘关系和影响分析。
用于数据资产展示、业务指标管理和系统故障排查。
数据质量管理:
收集数据质量管理需求,配置质量检查规则,部署检查脚本。
进行数据质量探查,包括自动和手动探查,以及质量评分管理。
3.2 数据共享服务试点应用
目录问题域:
建立目录清单、需求清单和责任清单,确保数据的系统性、针对性和压实数据采集责任。
供需对接:
推动挂接和编目,管理方负责审批/分发,需求方负责提出需求。
数据共享服务流程:
包括共享资源发布、申请、审核授权、调用以及管理与运维。
3.3 数据湖平台框架体系规划
服务提供商输入与分析:
包括业务与IT部门的输入、蓝图规划与演进、评估建议和现状调研。
总体架构规划:
涉及战略定位、目标与现状的对比、数据架构规划、技术架构规划等。
平台工具规划:
包括行业最佳实践、提升机会分析和平台提升建议。
数据共享服务规划:
涉及专家知识和运维体系规划。
逻辑架构:
搭建基础平台,以集团C端用户需求为试点打通数据湖链路。
数据架构:
定义数据源、采集、汇聚、治理、分析和共享服务等环节。
✦ 236页PPT
✦——