PostgreSQL 12
的可拔插存储引擎
--
表访问方法以及
bloackholes
案例
正文
PostgreSQL
使 用 自 定 义 插 件 做 扩 展 时 非 常 便 利 , 例 如
Decoder
plugins
、
extension
、
background workers
、索引访问方法、
hooks
、自定义函数、聚合、数据
类型等。
对代码做了大量的重构后,
PG12
具备了表访问方法的基础架构,允许自定义表数据如
何存储以及访问。默认情况下,
PG
的表还是使用
heap
存储引擎。他的工作原理是基于
8KB
的页面管理方式,并以段文件(默认
1GB
)的形式管理页面。需要保存所有版本的
tuple
。
这就意味着即使只修改
tuple
的一个字段,也需要存储整个新版本。这就使得
vaccum
和
autovacuum
变得更加昂贵。当然,本文目的不是讨论这个,需要了解的话可以查看手册。
表访问方法非常
cool
。允许以插件的形式集成到
PG
中,就像
MySQL
的多个存储引擎
一样,使实现诸如列存储的功能成为可能。做的方法大致分为两类:
通过
PG
存储管理器的访问方法,充分利用现有的
shared bu%er
层以及现有的页格式。
有
2
个优势:自动支持备份和
checksum
。
不通过
PG
的访问方法。不依赖于
PG
的
shared bu%er
。使完全依赖于操作系统换成成
为可能。当然,需要自己添加函数来完成对
checksum
和备份的支持。
O'awa
的
PG
大会上有两个主题关于这个特性:
h'ps://www.pgcon.org/2019/schedule/events/1374.en.html
h'ps://www.pgcon.org/2019/schedule/events/1321.en.html
最近人们开始讨论新的
AMs
如
zheap
或者
zstore
。可拔插的
WAL
也收到限制,
WAL
需
要注册大量的回调函数,
resource manager IDs
需要
hard values
。依赖于
AM
时,
TIDs
会成
为一个重要问题。
有大量的回调函数定义了
AM
表是什么(当前有
42
个),未来接口可能会改变。
我写了个简单的
demo
作为表访问方法
blackhole_am
。作为一个新插件的一个
demo
,
操作函数都是空函数。创建表访问方式需要
CREATE ACCESS METHOD
。编译后生成一个动态
链接库,以扩展插件的形式集成到
PG
。
=# CREATE EXTENSION blackhole_am;
CREATE EXTENSION
=# \dx+ blackhole_am
Objects in extension "blackhole_am"
Object description
-----------------------------------------
access method blackhole_am
function blackhole_am_handler(internal)
(2 rows)
表定义方式,参数
default_table_access_method
控制表访问方法,设置后可以不指定
using
:
=# CREATE TABLE blackhole_tab (id int) USING blackhole_am;
CREATE TABLE
=# INSERT INTO blackhole_tab VALUES (generate_series(1,100));
评论