暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据质量评价方法现状

原创 seali2008 2022-06-27
1010

目前关于数据质量评价方法的研究,主要包括定性评价、定量评价以及定性定量相结合的3种评价方法。

1)定性评价

定性评价是依据专业领域知识和个人经验理解,按照一定的评价标准进行估计和推断的一种评价方法。目前的定性评价方法主要是数据质量指标量化法,许多学者认为数据质量是一个多维度的概念,因此从不同角度提出了数据质量评价的定性指标。早期,有些学者提出了数据质量评价的最基本的4个指标,即准确性、时效性、完整性和一致性,在此基础上,现在有些学者将各个现有指标归类,分为直接指标体系和间接指标体系,并采用GQM(目标一问题式)的方式构建数据质量评价指标。

2)定量评价

定量评价主要是通过数学或其他科学手段而做出的判断和分析评估,能够较好地保证评估结果的科学性和客观性,使其具有较好的信度,多数用于结构化数据库的评价,如针对关系数据库数据质量的精确性和完整性两个重要指标进行评价时,通过关系代数操作进行量化,通过数据和“最近似”间的信息量差异来定量分析;基于概率论,对数据质量的时效性指标建立评价体系.

3)定性定量相结合的评价

定性定量相结合的评价,其主要做法是在定性评价方法的基础上引入数学手段,定性问题通过人工设定的标准进行评分并做出量化处理,评分的过程都是针对事先建立的指标体系,具有部分数理统计的特征,如德尔菲法、模糊综合评估法、层次分析法等。

定性评价主要是用于满足数据用户的需求,主要是采用数据质量调查的方式构建评价指标体系;定量评价是一种客观评价方法,但一般缺少上下文的情景知识,仅是依赖于应用程序的规则或约束判断,除了常用于结构化数据的评价外,部分自动化评估技术也被应用于网络数据资源的质量评价;在数据质量的多维度评价上,定性定量相结合的评价是目前较为常见的评估方法。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论