暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

【必知】数据仓库与数据库的区别。

勾叔谈大数据 2021-04-22
246
大家好,我是勾叔。今天和大家谈一下数据仓库与数据库的区别。


数据库与数据仓库的区别实际是OLTP与OLAP的区别。
  • OLTP(On-Line Transaction Processing 联机事务处理),也称面向交易的处理系统,主要针对具体业务在数据库系统的日常操作,通常对少数记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理。
  • OLAP(On-Line Analytical Processing 联机分析处理),一般针对某些主题的历史数据进行分析,支持管理决策。

数据仓库的出现,并不是要取代数据库,而是主要用于解决企业级的数据分析问题或者说管理和决策。数据库与数据仓库的区别如下:
  • 数据库是面向事务的设计,数据仓库是面向主题设计的;
  • 数据库存储有限期限的业务数据,数据仓库存储的是企业历史数据;
  • 数据库设计尽量避免冗余,数据存储设计满足第三范式,但是便于进行数据分析,数据仓库在设计时有意引入冗余,依照分析需求,分析维度、分析指标进行设计;
  • 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

以银行业务为例。数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,这里,可以简单地理解为用数据库记账。数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。如果存取款多,消费交易多,那么该地区就有必要设立ATM了。

银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。而分析系统是事后的,它要提供关注时间段内所有的有效数据,这些数据是海量的,汇总计算起来也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。

大家如果想进行更深入的了解和学习,请关注勾叔谈大数据参与更多互动。


推荐阅读:
【必知】Kafka零拷贝技术
【数据建模】如何完成模型集成?
【数据建模】如何选择一个适合需求的算法?
【数据挖掘】如何处理出完整、干净的数据?
文章转载自勾叔谈大数据,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论