暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

GBase 8a V95 分区表的使用与说明

努力的贾维斯 2022-06-10
798

前言

分区是数据库领域中处理大数据量的一种有效的技术手段,通过使用分区,可增强数据库的可用性、降低维护成本、均衡磁盘I/O,并有效改善查询性能。

分区表是根据一定规则,将数据库中的一张表分解成多个更小的容易管理的部分,从逻辑上看,只有一张表,但底层却是由多个物理分区组成。

分区表包括普通分区表和子分区表。表分区的总个数为64个。

目前常用的分区方法有RANGE分区、LIST分区、KEY分区、HASH分区,在分区的管理上目前支持创建分区、添加分区、删除分区。

RANGE分区表和LIST分区表支持子分区,子分区的分区类型可以为[LINEAR] HASH和[LINEAR] KEY。

功能优点

1、 与单个磁盘或文件系统分区相比,可以存储更多的数据。

2、 对于那些已经失去保存意义的数据,通常可以通过删除与那些数据有关的分区,很容易地删除那些数据。相反地,在某些情况下,添加新数据的过程又可以通过为那些新数据专门增加一个新的分区,来很方便地实现。

3、 一些查询可以得到极大的优化,这主要是借助于满足一个给定WHERE语句的数据可以只保存在一个或多个分区内,这样在查找时就不用查找其他剩余的分区。因为分区可以在创建了分区表后进行修改,所以在第一次配置分区方案时还不曾这么做时,可以重新组织数据,来提高那些常用查询的效率。

4、 涉及到例如SUM()和COUNT()这样聚合函数的查询,可以很容易地进行并行处理。这种查询的一个简单例子如下

SELECT salesperson_id, COUNT (orders) as order_total FROM sales GROUP BY salesperson_id;”

通过“并行”,这意味着该查询可以在每个分区上同时进行,最终结果只需通过总计所有分区得到的结果。

5、 通过跨多个磁盘来分散数据查询,来获得更大的查询吞吐量。

示例

gbase> CREATE TABLE t1 ( 
 -> a int(11) DEFAULT NULL, 
 -> b varchar(10) DEFAULT NULL 
 -> ) REPLICATED PARTITION BY RANGE (a) 
 -> (PARTITION p0 VALUES LESS THAN (10) , 
 -> PARTITION p1 VALUES LESS THAN (20) , 
 -> PARTITION p2 VALUES LESS THAN (30) , 
 -> PARTITION p3 VALUES LESS THAN (40) ) ; 
Query OK, 0 rows affected (Elapsed: 00:00:00.11)
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论