宽表的定义:
宽表从字面意义上讲就是字段比较多的数据库表。通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。
范畴:
狭义:fdm表
广义:fdm表、gdm表
宽表的本质:
用空间换时间
建设宽表的3个好处:
1、统一口径
2、降低统计难度,减少多表关联和函数处理操作
3、节省跑数时间
4、节省计算资源
宽表的几种颗粒度:
1、用户/账户粒度明细数据
2、订单粒度明细数据
3、每天-业务概念组合(譬如:活动/渠道/奖品)产品概念组合(譬如:操作平台)-指标(金额,人数 次数)
4、每天-业务概念(譬如:活动/渠道,奖品)产品概念组合(譬如:操作平台)-用户-指标(金额、次数、人数)
关于耦合度:
1、使用频次一般的数据可以采用1、2两种颗粒度的宽表计算得到
2、使用频次很高的数据可以直接从3、4两种颗粒度的宽表获取
宽表设计的原则:
1、每个数值型字段的颗粒度要保持一致
2、每个字段的数据生产耗时不能相差太多
3、原始数据源颗粒度不同的宽表不太适合放到一个表里面,因为起不到降低取数难度的目的
为什么不用一个宽表满足所有需求:
1、字段的颗粒度不一样
2、字段的数据生产耗时不同
3、这种情况必须用最细的颗粒度,会牺牲查询效率,并且导致很多冗余数值字段、null数值字段
4、表的字段会特别多,技术上不允许,也会影响性能
文章转载自小灰嘚吧嘚,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




