
点击箭头处“蓝色字”,关注我哦!!转载请注明出处!
1)尽可能生成丰富的维度属性
2)尽可能多地给出包括一些富有意义的文字性描述
3)区分数值型属性和事实
数值型字段是作为事实还是维度属性,可以参考字段的一般用途。如果通常用于查询约束条件或分组统计,则是作为纬度属性;如果通常用于参与度量的计算,则是作为事实。另外,如果数值型字段是离散值,则作为纬度属性存在的可能性比较大;如果数值型字段是连续值,则作为度量存在的可能性比较大,但并不绝对,需要同时参考字段的具体用途。
4)尽量沉淀出通用的维度属性
有些维度属性获取需要进行比较复杂的逻辑处理,有些需要通过多表关联得到,或者通过单表的不同字段混合处理得到,或者通过对单表的某个字段进行解析得到。此时需要将尽可能多的通用的维度属性进行沉淀。一方面,可以提高下游使用的方便性,减少复杂度;另一方面,可以避免下游使用解析时由于各自逻辑不通而导致口径不一致。
文章转载自薪火杂记,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




