暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据存储生命周期管理

原创 手机用户6603 2024-02-28
173

数据存储生命周期管理

定义

历史数据等级划分

根据历史数据的重要程度、可恢复性以及数据对项目影响程度,对数据仓库中的历史数据等级进行划分。通常,划分为P0、P1、P2、P3四个等级,其具体定义如下:

  • P0:非常重要的主题域数据和应用数据,具有不可恢复性,如:交易数据、操作日志等;

    • 该等级的数据一旦丢失,将会引起重大损失等;

  • P1:重要的业务数据和应用数据,具有不可恢复性,如:用户数据、资源数据;

  • P2 :重要的业务数据和应用数据,具有可恢复性,如:如:ETL产生的中间过程数据;

  • P3 :不重要的业务数据和应用数据,具有可恢复性,如:报表数据;

数据表分类(按技术)

增量表(Incremental Table)

定义:增量表是指在数据仓库中仅存储数据变化部分的表,一般是指在上个处理周期之后到当前数据处理时新增的数据;也可以通过与全量表进行比较来获取数据的变化情况;增量表在数据处理中具有较高的效率和可扩展性,但需要一定的数据处理技术来维护增量表的准确性;一般是保存事件类、日志类、操作类等数据,具有以下特点:

  • 记录每次增加的量,而不是总量;

  • 增量表,只报变化量,无变化不用报;

  • 一般是一个周期(小时、天等)一个分区;

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论