

长按二维码关注
大数据领域必关注的公众号

本规范规定了中国移动企业级省大数据平台数据治理子系统的建设内容,适用于中国移动各省(直辖市、自治区)公司企业级省大数据平台数据治理子系统的建设。
下列文件中的条款通过本规范的引用而成为本规范的条款。凡是标注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本规范。然而,鼓励根据本规范达成协议的各方对是否使用这些文件的最新版本进行研究。凡是不标注日期的引用文件,其最新版本适用于本规范。
下列术语、定义适用于本规范:
下列略缩语适用于本规范:
4、总体说明
本规范用于指导企业级省大数据平台数据治理子系统建设,规定了省大数据平台数据治理的范围和要求,明确了数据治理子系统的体系结构,制定了数据治理子系统的功能和处理流程。数据治理子系统包含数据标准管理、元数据管理、数据质量管理、数据资产管理、数据安全管理等功能模块。本方案借鉴资产管理的方法理论来管理数据,将数据作为一种特殊的资产,对进入平台的数据进行标准化的规范约束,并以元数据作为驱动,连接数据的标准管理、数据质量管理、数据数据安全管理的各个阶段,形成统一、完善的数据治理体系,以解决实际业务问题为导向,增强数据治理子系统对业务发展的支撑能力。
数据治理子系统的建设为数据治理工作提供强有力的系统支撑。本期规范建设目标是以元数据为驱动,建立省大数据平台完整的数据治理体系。从组织架构、系统功能等方面增强数据宏观管控,并实现精细化管理,具体包括:
数据治理组织架构管理:定义数据治理所需人员组织上的岗位和职责,从管理角度支撑数据治理工作的落地和执行。 数据标准管理:建立企业级省大数据平台数据标准体系,并制定数据标准运维管控制度和流程。 元数据管理:降低元数据使用难度、提升用户体验,使大数据平台各类用户均能参与到元数据运营维护当中。 数据质量管理:为内、外部用户提供平台化的数据质量监控;通过扩充和优化公共规则库、保证数据的完整性、一致性、准确性、及时性、合法性,提升用户使用感知;并提供数据质量应用满足个性化需求。 数据资产管理:重点建设从规划、注册、运维到注销的全流程管理体系,使数据资产管理系统化、可视化。 数据安全管理:建立体系化的数据安全管控策略,通过用户安全管理、数据安全管理实现全方位数据安全管控机制,通过技术手段与管理措施相结合的方式落实数据安全,做到事前可管、事中可控、事后可查。
1.有效性原则
2.价值化原则
3.统一性原则
4.开放性原则
5.产品化原则
6.安全性原则
数据治理总体框架包括组织架构、数据治理模块、数据运维三部分。通过组织架构建立管理办法,制定工作流程,确定角色职责。数据治理模块主要包括数据标准管理、元数据管理、数据质量管理、数据资产管理、数据安全管理,各模块协同运营,确保大数据平台的数据一致、安全、有效。数据运维贯穿整个数据治理体系的流程中,实现平台化的运维管理思路。数据治理总体框架如图5-1所示:

数据治理组织的构建旨在通过建立数据治理组织架构明确各级角色和职责,保障数据治理的各项管理办法、工作流程的实施,推送数据治理工作的有序开展。
数据治理组织架构主要由数据治理委员会、数据治理中心和各业务部门构成。组织架构划分和角色设定如图5-2所示:

组织责任体系是数据治理责任落地的保障,数据治理组织架构通过明确各角色职责,实行认责制度,让数据治理工作更好的融入到数据日常使用和相关的工作中,从而推动数据运维自治的实现,如表5-1。
数据治理功能框架明确了数据治理在企业级省大数据平台中的定位,并以合理的功能层次划分指导数据治理系统相关功能建设。系统功能框架如图5-3所示。

企业级省大数据平台门户:
企业级省大数据平台统一的访问接口,供企业内、外部用户、第三方独立开发者访问及使用数据治理相关产品或功能,并负责统一访问认证及日志记录。
能力开放平台:
企业级省大数据平台统一的对外服务层,数据治理相关的产品及应用均通过这个层次进行注册、发布,并对内、外部开放。
数据治理系统:
※ 数据标准:在数据标准管理组织架构推动和指导下,遵循协商一致制定的数据标准规范,借助标准化管控流程得以实施数据标准化的整个过程。
※ 元数据:采用集中式管理模式进行元数据管理,全公司元数据逻辑集中,即元数据管理模块作为公司元数据的统一发布源,集中管理元数据,提供元数据集中创建、维护、查询功能。
※ 数据质量:对数据从计划、获取、存储、共享、维护、应用、消亡生命周期的每个阶段里可能引发的各类数据质量问题,进行识别、度量、监控、预警等一系列管理活动,并通过改善和提高组织的管理水平使得数据质量获得进一步提高。
※ 数据资产:规划、控制、提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、提高数据资产的价值。
※ 数据安全:通过计划、制定、执行数据安全政策和安全策略措施,为企业级大数据平台的数据和信息提供行之有效的认证、授权、访问和审计。
※ 数据运维:包括数据资产运维、数据质量运维,借鉴互联网思维,通过产品化运维工具来整体提升企业级大数据平台数据运维效率。
企业级省大数据平台:
※ 大数据基础平台,负责数据的接入、存储、管理、应用及相关基础功能支撑。

如图5-4所示,数据治理系统各模块之间,根据数据操作的流程产生相互关联,各模块业务流程关系说明如下:
L1:数据标准管理模块将标准定义映射到元数据信息上,实现数据标准的规范要求落地。
L2:元数据管理模块为数据资产管理模块提供存储模型、属性信息查询服务。
L3:元数据管理模块为数据质量管理模块提供元数据相关属性信息。
L4:用户通过元数据定义大数据平台的数据结构。
L5:数据质量管理模块根据采集需求从大数据平台采集数据。
L6:数据质量管理模块将数据质量问题反馈给大数据平台。
L7:数据质量管理模块向资产模块提交数据质量评估结果。
L8:元数据管理模块为数据安全管理模块提供隐私级别定义服务。
L9:数据资产管理模块发起资产访问申请,由数据安全管理模块控制用户访问权限,控制数据资产的增加、删除、变更操作权限,对访问的数据内容、数据属性等操作进行管控。
L10:数据安全管理模块为大数据平台提供数据访问权限策略。
企业级省大数据平台数据治理子系统与其它子系统之间存在数据交互、功能调用、流程穿插等关联。数据治理子系统与大数据平台系统内其它子系统的关系示意如图5-5所示:

企业级省大数据平台上的数据资产是数据治理的主要对象;数据治理为企业级省大数据平台提供数据标准指导、元数据定义、数据质量监控、数据安全等方面的全面支撑,使大数据平台上的数据资产清晰、有序、安全、可控。
数据治理为对外能力开放平台提供元数据查询、数据安全管理支持;对外能力开放平台为数据治理提供统一的数据治理产品及功能注册、发布、使用服务。
数据治理子系统支撑大数据平台的数据管控流程,并与平台运维交互协调,共同支撑大数据平台整体的安全运维、数据运维和管理运维。
完





