前言
分区是数据库领域中处理大数据量的一种有效的技术手段,通过使用分区,可增强数据库的可用性、降低维护成本、均衡磁盘I/O,并有效改善查询性能。
分区表是根据一定规则,将数据库中的一张表分解成多个更小的容易管理的部分,从逻辑上看,只有一张表,但底层却是由多个物理分区组成。
分区表包括普通分区表和子分区表。表分区的总个数为64个。
目前常用的分区方法有RANGE分区、LIST分区、KEY分区、HASH分区,在分区的管理上目前支持创建分区、添加分区、删除分区。
RANGE分区表和LIST分区表支持子分区,子分区的分区类型可以为[LINEAR] HASH和[LINEAR] KEY。
功能优点
1、 与单个磁盘或文件系统分区相比,可以存储更多的数据。
2、 对于那些已经失去保存意义的数据,通常可以通过删除与那些数据有关的分区,很容易地删除那些数据。相反地,在某些情况下,添加新数据的过程又可以通过为那些新数据专门增加一个新的分区,来很方便地实现。
3、 一些查询可以得到极大的优化,这主要是借助于满足一个给定WHERE语句的数据可以只保存在一个或多个分区内,这样在查找时就不用查找其他剩余的分区。因为分区可以在创建了分区表后进行修改,所以在第一次配置分区方案时还不曾这么做时,可以重新组织数据,来提高那些常用查询的效率。
4、 涉及到例如SUM()和COUNT()这样聚合函数的查询,可以很容易地进行并行处理。这种查询的一个简单例子如下
“SELECT salesperson_id, COUNT (orders) as order_total FROM sales GROUP BY salesperson_id;”通过“并行”,这意味着该查询可以在每个分区上同时进行,最终结果只需通过总计所有分区得到的结果。
5、 通过跨多个磁盘来分散数据查询,来获得更大的查询吞吐量。
示例
gbase> CREATE TABLE t1 (
-> a int(11) DEFAULT NULL,
-> b varchar(10) DEFAULT NULL
-> ) REPLICATED PARTITION BY RANGE (a)
-> (PARTITION p0 VALUES LESS THAN (10) ,
-> PARTITION p1 VALUES LESS THAN (20) ,
-> PARTITION p2 VALUES LESS THAN (30) ,
-> PARTITION p3 VALUES LESS THAN (40) ) ;
Query OK, 0 rows affected (Elapsed: 00:00:00.11)「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




