暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
Postgres-XL使用说明文档.pdf
473
29页
9次
2022-08-09
5墨值下载
美河学习在线 www.eimhe.com
Postgres-XL 使用说明文档
一、知识点介绍
Postgres-XL 是一个基 PostgreSQL 数据库的横向扩展开源 SQL 数据库集群,XL 代表
eXtensible Lattice即可扩展的 PG“格子之意,以下简称 PGXL官方称其既适合写操作压力
较大的 OLTP
1
应用,又适合读操作为主的大数据应用。它的前身是 Postgres-XC(简称 PGXC),
PGXC 是在 PG 的基础上加入了集群功能,主要适用于 OLTP
2
应用;PGXL 是在 PGXC 的基础上
的升级产品,加入了一些适用于 OLAP 应用的特性, Massively Parallel Processing (MPP)
性。通俗的说 PGXL 的代码是包 PG 代码的,使用 PGXL 安装 PG 集群并不需要单独安装 PG
总体感觉 PGXL 这款工具还是相当成熟的,有官方网站 http://www.postgres-xl.org/,文
档也比较完善,也有商业公司 2ndQuadrant 在支持
上面这张图就 PGXL 集群的架构图,来自官方网站。所有节点中分为三种角色:GTM
(全局事务管理器)Coordinator(协调器) Datanode(数据节点)需要注意一点是图中
1
OLTP 联机事务处理过程(On-Line Transaction Processing),也称为面向交易的处理过程,其基本
特征是前台接收的用户数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果,是对用
户操作快速响应的方式之一。OLTP 系统强调数据库内存效率,强调内存各种指标的命令率,强
调绑定变量,强调并发操作;
2
OLAP,也叫联机分析处理(On-line Analytical Processing)系统,有的时候也叫 DSS
决策支持系统,就是我们说的数据仓库。在这样的系统中,语句的执行量不是考核标准,
因为一条语句的执行时间可能会非常长,读取的数据也非常多。所以,在这样的系统中,
考核的标准往往是磁盘子系统的吞吐量(带宽),如能达到多少 MB/s 的流量。OLAP 系统
则强调数据分析,强调 SQL 执行市场,强调磁盘 I/O,强调分区等。
美河学习在线 www.eimhe.com
Load Balance 组件并不属于 PGXL 集群本身,需要其他负载均衡工具实现。
GTM
全局事务控制节点,保证集群数据的一致性, Coordinator 节点和 Datanode 节点不断
通信,是整个集群的核心节点,只存在一个,可以存在一个 GTM Standby 节点,对 GTM
时备份。GTM 一旦故障,整个集群立刻无法访问,此时可以切换 GTM Standby 节点上。
果部署了 GTM Standby 节点,就应该同时部署 GTM Proxy一般和 CoordinatorDatanode
署在同一台服务器上。GTM Proxy 的作用代理 Coordinator Datanode GTM 的访问,
减轻 GTM 负载的作用,另外一个重要的作用是帮助完成 GTM 的故障切换,当 GTM 节点发
生故障后,GTM Standby 成为新的 GTM此时 Coordinator Datanode 节点并不需要重新指
GTM 地址,只需要 GTM Proxy 重新连接到新的 GTM 地址即可。
Coordinator
接收数据访问请求的节点,本质上是由 PG
Coordinator 节点执行查询计划,然后会根据查询数据涉及的数据节点将查询分发给相关的
Coordinator 节点上保存着集群的全局数据位置Coordinator 节点可以任意扩展,各个节点
之间除了访问地址不同以外是完全对等的通过一个节点更新的数据可以在另一个节点上立
刻看到。每个 Coordinator 节点可以配置一个对应的 standby 节点,避免单点故障。
Datanode
实际存取数据的节点,接收 Coordinator 的请求并执 SQL 语句存取数据,节点之间
会互相通信。一般的,一个节点上的数据并不是全局的,数据节点不直接对外提供数据访问
一个表的数据在数据节点上的分布存在两种模式:复制模式和分片模式,复制模式下一个
表的数据在指定的节点上存在多个副本;分片模式下,一个表的数据按照一定的规则分布在
多个数据节点上这些节点共同保存一份完整的数据。这两种模式的选择是在创建表的时候
执行 CREATE TABLE 语句指定的,具体语法如下:
CREATE TABLE table_name(...)
DISTRIBUTE BY
HASH(col)|MODULO(col)|ROUNDROBIN|REPLICATION
TO NODE(nodename1,nodename2...)
可以看到,如果 DISTRIBUTE BY 后面是 REPLICATION,则是复制模式,其余则是分片模
式,HASH 指的是按照指定列的希值分布数据,MODULO 指的是按照指定列的取摩运算
布数据,ROUNDROBIN 指的是按照轮的方式分布数据。TO NODE 指定了数据分布的节点范
围,如果没有指定则默认所有数据节点参与数据分布。如果没有指定分布模式,即使用普通
CREATE TABLE 语句,PGXL 默认采用分片模式将数据分布到所有数据节点。
of 29
5墨值下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜