1.pg_dump 概述
1.1 pg_dump 介绍
https://www.postgresql.org/docs/14/app-pgdump.html
pg_dump是用于备份一种PostgreSQL数据库的工具。即使数据库正在被并发使用,它也能创建一致的备份。pg_dump不阻塞其他用户访问数据库(读取或写入)。
pg_dump只转储单个数据库。要备份一个集簇或者集簇中 对于所有数据库公共的全局对象(例如角色和表空间),应使用 pg_dumpall。
可以选择一个数据库或部分表进行备份,恢复过程可以跨平台迁移
可以在数据库正在使用时进行完整一致的备份,并不阻塞其它用户对数据库的访问
只能备份单个数据库,不会导出角色和表空间相关的信息
1.2 pg_dump四种转储格式
Plain、custom、directory、tar
Plain 是纯文本格式跟pg_dumpall转储一样。你可以用psql加载它,如果转储很大,提取部分可能会很复杂。
使用pg_restore程序恢复所有其他格式(custom,directory和tar)
Pg_dump四种转储格式:
-F t tar格式的转储输出格式,不支持压缩,在早期版本有单表8G限制,目前版本已经改善
-F d 以目录的格式创建备份,备份出来的是一个包含若干个目录的备份文件,可以指定并行备份-j
-F c 备份为二进制格式, 压缩存储. 并且可被pg_restore用于精细还原,输出输入 IO 比较稳定
-F p 备份为文本, 大库不推荐, 文本方式 ,对 IO 不可控,不稳定

2.pg_dump 使用
pg_dump --help
2.1 Usage:
pg_dump [OPTION]... [DBNAME]
2.2 General
一般选项:-f, --file=FILENAME 输出文件或目录名-F, --format=c|d|t|p 输出文件格式 (custom, dir, tar) tezt(默认值))-j, --jobs=NUM 执行多个并行任务进行备份转储工作-v, --verbose 详细模式-V, --version 输出版本信息,然后退出-Z, --compress=0-9 被压缩格式的压缩级别--lock-wait-timeout=TIMEOUT 在等待表锁超时后操作失败--no-sync 不需要等待,执行刷盘-?, --help 显示此帮助, 然后退出
2.3 output content
控制输出内容选项:-a, --data-only 只转储数据,不包括模式-b, --blobs 在转储中包括大对象-B, --no-blobs 在转储中排除大对象-c, --clean 在重新创建之前,先清除(删除)数据库对象 *****-C, --create 在转储中包括命令,以便创建数据库-E, --encoding=ENCODING 转储以ENCODING形式编码的数据-n, --schema=PATTERN 只转储指定名称的模式-N, --exclude-schema=PATTERN 不转储已命名的模式-O, --no-owner 在明文格式中, 忽略恢复对象所属者-s, --schema-only 只转储模式, 不包括数据-S, --superuser=NAME 在明文格式中使用指定的超级用户名-t, --table=PATTERN 只转储指定名称的表-T, --exclude-table=PATTERN 不转储指定名称的表-x, --no-privileges 不要转储权限 (grant/revoke)--binary-upgrade 仅供升级实用程序使用--column-inserts 以带有列名的INSERT命令形式转储数据--disable-dollar-quoting 取消美元 (符号) 引号, 使用 SQL 标准引号--disable-triggers 在恢复数据的过程中禁用触发器--enable-row-security 启用行安全性(只转储用户能够访问的内容)--exclude-table-data=PATTERN 不转储指定名称的表中的数据--extra-float-digits=NUM 覆盖 extra_float_digits 的默认设置--if-exists 当删除对象时使用IF EXISTS--inserts 以INSERT命令,而不是COPY命令的形式转储数据--load-via-partition-root 通过根表加载分区--no-comments 不转储评论--no-publications 不转储出版物--no-security-labels 不转储安全标签分配--no-subscriptions 不转储订阅--no-synchronized-snapshots 在并行作业中不使用同步快照--no-tablespaces 不转储表空间分配--no-unlogged-table-data 不转储未记录的表数据--on-conflict-do-nothing 添加 ON CONFLICT DO NOTHING 到 INSERT 命令--quote-all-identifiers 引用所有标识符,即使不是关键字--rows-per-insert=NROWS 每个插入的行数;暗示 --inserts--section=SECTION 转储命名节(前数据、数据或后数据)--serializable-deferable 等到转储可以无异常运行--snapshot=SNAPSHOT 使用给定的快照进行转储--strict-names 要求表和/或模式包含模式以匹配每个至少一个实体--use-set-session-authorization使用 SET SESSION AUTHORIZATION 命令而不是 ALTER OWNER 命令来设置所有权
2.4 Connection options
Connection options-d, --dbname=DBNAME 对数据库 DBNAME备份-h, --host=HOSTNAME 数据库服务器的主机名或套接字目录-p, --port=PORT 数据库服务器的端口号-U, --username=NAME 以指定的数据库用户联接-w, --no-password 永远不提示输入口令-W, --password 强制口令提示 (自动)--role=ROLENAME 在转储前运行SET ROLE
3. pg_dump 示例
3.1 默认的文本方式
# 备份数据库pg_dump -Fp-f/tmp/testdb.sql -C -E UTF8 -h 127.0.0.1 -U postgres testdb#或 简单语法 ,默认就是文本的方式pg_dump testdb >/tmp/testdb.sql# 将数据恢复到 testdb1 , 导入数据时首先创建数据库createdb testdb1psql testdb1</tmp/testdb.sql
3.2 二进制备份文件
#二进制格式备份文件, 指定类开 -F cpg_dump -F c -f tmp/testdb.dmp -C -EUTF8 -h 127.0.0.1 -U postgres testdb#可选,解析二进制格式的备份文件 ,查看二进制文件的备份内容pg_restore -f tmp/a.log tmp/testdb.dmp#可选,-l 生成备份集的toc例表,可以编辑该toc文件 ,注释其中的表,恢复部份对象pg_restore -l -f tmp/a.toc tmp/testdb.dmp# 二进制格式 ,tar 格式 ,目录格式 ,都需要用pg_restore 来恢复pg_restore -d testdb1 tmp/testdb.dmp #需要先创建目标库,还原恢复
4.pg_dump 扩展
4.1.生成toc文件进行选择性恢复
1)根据二进制备份文件生成toc文件
pg_restore -l -f /tmp/toc1 /tmp/testdb.dmp
2)修改 toc文件,以首行加分号“;”的方式注释掉不用还原的内容
vi tmp/toc1265; 1259 25280 TABLE public postgres_log postgres266; 1259 25293 TABLE public t2 postgres213; 1259 16385 TABLE public test postgres3660; 0 25280 TABLE DATA public postgres_log postgres;3661; 0 25293 TABLE DATA public t2 postgres # 这个表用; 注释了,不会恢复;3659; 0 16385 TABLE DATA public test postgres # 这个表用; 注释了,不会恢复3520; 2606 25287 CONSTRAINT public postgres_log postgres_log_pkey postgres3442; 1259 25269 INDEX public idx_test postgres
3)以toc文件列表做恢复pg_restore –F c -L tmp/toc -d testdb tmp/testdb.dmp
4.2使用unix管道备份恢复
1. 压缩与解压
pg_dump testdb| gzip > /tmp/testdbbak.sql.gz #操作系统压缩gunzip -c /tmp/testdbbak.sql.gz | psql testdb2 #解压缩恢复
2.备份恢复数据不落盘
pg_dump testdb | psql testdb1 #备份testdb ,马上又还原到 testdb1,testdb1库要先创建, 数据不落盘,这路对小数据进行测试是非常方便的。
3.分割备份文件
备份:pg_dump dbname | split-b1m- filename恢复:catfilename* | psql dbname
4.3.并行处理
pg_dump -Fd -j4 -f /tmp/db.dir testdb #-F d 以目录的格式创建备份pg_restore -d testdb3 -j4 /tmp/db.dir-j 参数指定同时几个进程来同时执行,每个进程同时只处理一个表的数据。
5.补充
逻辑备份,相对灵活,可以排除大表。可以结合物理备份使用。
如果备份以默认的明文方式保存,输出输入 IO 不可控,生产环境中建议使用 -F c 二进制方式备份比较稳定 。
文章转载自AsherHu,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




