大数据时代,数据资产及其价值利用能力逐渐成为构成企业核心竞争力的关
键要素;然而,大数据应用必须建立在质量可靠的数据之上才有意义,建立
在低质量甚至错误数据之上的应用有可能与其初心南辕北辙、背道而驰。因
此,数据质量正是企业应用数据的瓶颈,高质量的数据可以决定数据应用的
上限,而低质量的数据则必然拉低数据应用的下限。
数据质量定义
数据质量的高低代表了该数据满足数据消费者期望的程度,这种程度基于他
们对数据的使用预期。数据质量必须是可测量的,把测量的结果转化为可以
理解的和可重复的数字,使我们能够在不同对象之间和跨越不同时间进行比
较。 数据质量管理是通过计划、实施和控制活动,运用质量管理技术度量、
评估、改进和保证数据的恰当使用。
数据质量维度
1、准确性:数据不正确或描述对象过期
2、合规性:数据是否以非标准格式存储
3、完备性:数据不存在
4、及时性:关键数据是否能够及时传递到目标位置
5、一致性:数据冲突
6、重复性:记录了重复数据
评论