作者:稀饭
1、数据治理的定义
国际数据管理协会(DAMA)对数据治理的定义是:数据治理是对数据资产管理行使权力和控制的活动集合。在实际中,所有为提高数据质量而展开的技术、业务和管理活动都属于数据治理范畴。数据治理的最终目标就是提高数据的利用率和数据价值,通过有效的数据资源管控手段,实现数据看得见、找得到、管得好、用的舒适的目标,提升数据质量和价值。
2、数据治理中的一些常用概念
(1)数据元
是指用一组属性描述定义、标识、表示和允许值的数据单元。数据元由三个部分组成,包括“对象”、“特性”和“表示”。例如,个人信息中心,手机号为数据元,“131********”为数据元的值。
(2)元数据
是描述数据的数据,或者是关于数据的结构化数据。比如,一本教材的封面和目录展示了“图书名称”、“作者”、“出版时间”等元数据信息。在数据治理中,元数据是对数据描述,存储着数据的描述信息。可以通过元数据管理和查找想要的“数据”。
(3)主数据
主数据是企业内需要在多个部门、多个信息系统之间共享的数据。例如客户、供应商、组织、人员、项目、物料等数据。与容易波动的交易数据相比,主数据变化较慢。主数据是企业开展业务的基础,只有得到正确维护,才能保证业务系统的参照完整性。主数据在数据治理中的主要作用是用来解决企业异构系统之间核心数据不一致、不正确、不完整等问题。
(4)业务数据
是业务活动过程或系统自动产生的既定事实的数据,也称为交易数据。业务数据主要面向应用,为业务应用提供服务,例如生产、销售、采购、设备管理、系统管理等。
(5)主题数据
是根据数据分析的需求,按照业务主题对数据所做的一种组织和管理方式,其本质是为了进行面向主题的分析或加速主题应用的数据。主题数据是分析型数据,是按照一定的业务主题域组织的,服务于人们在决策时所关心的重点方面。一个主题数据可以由多个主数据和交易数据组成。主题数据一般是汇总的、不可更新的、用于读的数据。
(6)数据仓库
是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理和决策。数据仓库是为企业所有级别的决策制定过程中提供所有类型数据支撑的战略集合。
(7)数据湖
是一个以原始格式存储数据的存储库或系统,按照原始样貌将数据进行存储,而无需事先对数据进行结构化处理。数据湖可以存储结构化数据、半结构化数据、非结构化数据和二进制数据等。数据湖可以更方便、以更低成本解决不同数据结构的统一存储问题,同时还能够为机器学习提供全局数据。
3、数据资产
(1)定义
数据资产是指由企业过去的交易或者事项形成的,并由企业拥有和控制,预期会给企业带来经济利益的数据资源,并且其价值和成本是可以计量的。
(2)数据成为数据资产的四个核心条件
① 数据资产是企业的交易或事项形成;
② 由企业控制或拥有;
③ 预期会给企业带来经济利益;
④ 成本或价值可以衡量。
(3)数据资产的利益相关方
① 数据的生产者;
② 数据的拥有者或控制者;
③ 数据价值和经济利益的受益者。
(4)数据治理和数据资产的关系
数据治理从本质上来说,不是对“数据”的治理,而是对“数据资产”的治理。数据治理可以有效盘活企业的数据资产。
4、数据治理的价值
(1)降低业务运营成本,提升业务处理效率;
(2)改善数据质量并控制数据风险;
(3)增强数据安全;
(4)赋能管理决策。
5、数据治理面临的五类问题
(1)黑暗数据
也叫睡眠数据,是指被收集和处理,但又不用于任何用途的数据,有数据而不用,甚至业务部门和领导都不知道其存在,这些数据可能永远被埋没。除了睡眠数据外,很多时候还可能有“数据尾气”问题,数据尾气是指那些针对单一目标而收集的数据,通常在用过之后就会被归档闲置,其真正价值未能被充分挖掘。
(2)数据孤岛
是指企业发展到一定阶段,各个部门各自存储数据,部门之间的数据无法共通,导致数据像一个个孤岛一样缺乏关联性。
(3)数据不通
常见于不同部门、不同员工由于数据定义不清、口径不同、缺乏规范而无法顺畅交流与沟通。
(4)糟糕的数据质量
数据的可信性是影响数据分析和管理决策的重要因素,然而企业数据普遍存在着不一致、不完整、不准确、不正确、不及时的问题。
(5)数据的安全风险
数据如果缺乏有效管理,就比较容易产生数据安全问题。例如,缺少数据的采集、存储、访问和传输之间的规范制度,没有设定必要的数据使用权限,就必然会导致数据遗失、篡改或泄密。
6、企业数据治理常见的六个挑战
(1)对数据治理的业务价值认识不足;
(2)缺乏企业级数据治理的顶层设计;
(3)高层领导对数据治理不够重视;
(4)数据标准不统一,数据整合困难;
(5)业务人员普遍认为数据治理是IT部门的事情;
(6)缺乏数据治理组织和专业的人才。
广告区↓





