暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据仓库与数据分析的相关笔记(二)

初见数据仓库 2019-10-09
188


 今天来谈一下数据仓库与BI的关系。



01

数据仓库与BI的关系


数据仓库与BI的关系是下游与上游的关系。数据仓库用来存放经过清洗的数据,而BI用于做数据清洗后的展现。


数据仓库在经过清洗后,可以被BI所引用。清洗越干净的数据,在BI上展现的效果越好。而在BI上展现的数据,需要在数据仓库进行建模之后,方可。


 

02


数据仓库与BI的协助


以网易旗下的猛犸产品为例(源自网易官网,侵删),数据仓库从ODS-DW-DWS-DM层,数据集市层之后的数据就可以进行BI层面的建设了。

数据仓库与BI在日常工作中的做法会是:

数据仓库相关人员在以业务部门为主导下进行:

  • 进行数据仓库的模型建设

  • 确认好数据模型后

  • ETL相关人员开始做收集、转换、整合

  • 向数据集市加载数据


当加载完毕后,BI层面的展现,会以数据模型作为基准(有时可建设好数据立方体),作不同粒度的数据分析,应用切片、旋转等方式,对数据进行多维的分析展现,也可为后面的深层次AI智能分析、数据挖掘(如时间序列方法、聚类、分类等)奠定基础。


数据立方体(data cube)--引自百度百科:
数据立方体是一类多维矩阵,让用户从多个角度探索和分析数据集,通常是一次同时考虑三个因素(维度)。上图直观感受一下立方体:


 所以,也就是说,数据仓库(DW)是基石,在数据模型构建完成之后,BI的工作才真正开始了。数据仓库的数据清洗、模型构建,直接影响BI的展现。


文章转载自初见数据仓库,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论