01 数据治理问题场景
没有业务部门负责数据质量问题 数据质量需要跨职能合作 它要求组织认识到数据质量是一个重要问题 它需要数据质量准则 它需要投入财力和人力资源 它被认为是非常人力密集的 投资回报往往难以量化
但是,数据质量务必重视,原因有三。
原因一:成本
原因二:合规
数据缺失导致信用风险不准确
信用记录不完整致使风险评估错误
监管违规
原因三:决策
数据延迟,导致业务无法在正常时效内获得数据结果。
数据错误,导致数据结果完全不可信,以致无法使用。
数据恢复慢,问题发生后,排查分析耗时长,数据恢复时间慢。
04 数据质量问题原因
数据平台问题:平台不稳定、队列资源不足等,导致作业运行延迟、报错。 数据开发问题:数据开发人员的任务脚本性能太差,计算严重耗时,导致数据延迟;或是代码逻辑设计有问题,导致数据计算有误。 上游系统异常:上游源系统异常,数据文件晚到,导致下游依赖作业延迟。
05 数据质量治理

06 数据质量评价体系


数据完整性
监控覆盖率
告警响应度
作业准确性
作业稳定性
作业时效性
作业性能分
比如在银行业,每个库都有其对应的所属分层(如明细层、汇总层、应用层等),且每个库都有对应的库负责人,所以到库这个层级,我们能更好的分而治之,由库负责人对库的质量水平负责。



(本文来源平银零售大数据)
推荐文章:大数据分析平台技术架构建设方案
文章转载自大数据学习与分享,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




