暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

说说这些年做的数据库 GBase 8a-数据存储(4)

原创 白吉吉 2022-08-17
569

GBase 8a MPP Cluster V9是列存数据库,从字面就可以看出来,GBase 8a MPP Cluster V9版本延续了GBase 8a MPP Cluster 的列存设计,将数据库中的数据按列来组织存储。在列存的基础上,GBase 8a MPP Cluster在数据存储时将每65536行数据打成一个Data Cell(简称 DC)包,DC是最基本的存储单元。

从下图中可以看到,列与DC的关系:

在DC的基础上,GBase 8a MPP Cluster将每个DC包中记录的该DC包中数据的检索信息,包括null值个数、最大最小值等信息,这些数据的检索信息即为智能索引。这样做的好处是:
1)每个数据包在数据入库时自动建立智能索引,不需用户手工建立和维护;
2)在数据查询时不需要解包就能得到统计值、进行数据过滤,可进一步降低 I/O,对复杂查询的优化效果明显。
3)智能索引本身占空间少(1%左右),不会造成数据膨胀;
4)智能索引基于数据包建立,建立速度快,不受已存在数据包的影响。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

文章被以下合辑收录

评论