暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

宽表设计指南

小灰嘚吧嘚 2022-10-01
2510

宽表的定义:

宽表从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。

范畴:

狭义:fdm表

广义:fdm表、gdm表

宽表的本质:

用空间换时间

建设宽表的3个好处:

1、统一口径

2、降低统计难度,减少多表关联和函数处理操作

3、节省跑数时间

4、节省计算资源

宽表的几种颗粒度:

1、用户/账户粒度明细数据

2、订单粒度明细数据

3、每天-业务概念组合(譬如:活动/渠道/奖品)产品概念组合(譬如:操作平台)-指标(金额,人数 次数)

4、每天-业务概念(譬如:活动/渠道,奖品)产品概念组合(譬如:操作平台)-用户-指标(金额、次数、人数)

关于耦合度:

1、使用频次一般的数据可以采用1、2两种颗粒度的宽表计算得到

2、使用频次很高的数据可以直接从3、4两种颗粒度的宽表获取

宽表设计的原则:

1、每个数值型字段的颗粒度要保持一致

2、每个字段的数据生产耗时不能相差太多

3、原始数据源颗粒度不同的宽表不太适合放到一个表里面,因为起不到降低取数难度的目的

为什么不用一个宽表满足所有需求:

1、字段的颗粒度不一样

2、字段的数据生产耗时不同

3、这种情况必须用最细的颗粒度,会牺牲查询效率,并且导致很多冗余数值字段、null数值字段

4、表的字段会特别多,技术上不允许,也会影响性能

文章转载自小灰嘚吧嘚,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论