暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

PostgreSQL之PITR

2358

1、什么是PITR

PITR: 全称是Point-In-Time-Recover (时间点恢复),是PG从8.0版本开始引入的一个特性,该特性可以使用基础备份连续归档日志将数据库集群恢复到任意时间点

2、什么是基础备份?怎么获取基础备份?

在pg中,也是从8.0版本中引入了在线物理全备份,运行中的整个数据库集群的快照(即物理备份数据)被称为基础备份。

在pg中可以由两种方法获取基础备份:

  • 使用系统low-level函数:pg_start_backup、pg_stop_backup以及一些shell命令(如cp、tar、rsync等)。

  • 使用pg_basebackup工具

3、pg_start_backup做了什么?

pg_start_backup和pg_stop_backup命令定义见这里:

src/backend/access/transam/xlogfuncs.c 

链接:https://github.com/postgres/postgres/blob/master/src/backend/access/transam/xlogfuncs.c

pg_start_backup()是一个用来启动基本备份的函数。它是PostgreSQL 8.0中引入的原始物理备份API的一部分。

pg_start_backup主要执行以下几个操作:

  • 强制服务器进入全页写模式(即使你设置了full_page_writes=off)。

  • 执行checkpoint(我在前面checkpoint的文章中提过,数据库恢复的过程需要从一个REDO位置开始,所以pg_start_backup需要做checkpoint来创建一个REDO点)。

  • 创建一个backup_label文件。

4、backup_label文件的内容和作用什么?

一个backup_label示例:

    START WAL LOCATION: 0/9000028 (file 000000010000000000000009)
    CHECKPOINT LOCATION: 0/9000060
    BACKUP METHOD: pg_start_backup
    BACKUP FROM: master
    START TIME: 2021-5-10 11:45:19 GMT
    LABEL: Weekly Backup

    其中:

    CHECKPOINT LOCATION: 这是该函数创建的检查点被记录的LSN位置。当使用这个基础备份恢复数据库时,PostgreSQL从backup_label文件中获取“CHECKPOINT LOCATION”,并开始恢复过程。

    BACKUP METHOD: 标示用于进行基础备份的方法(pg_start_backup或pg_basebackup)。

    START TIME: 执行pg_start_backup时的时间戳。

    LABEL: 这是在调用pg_start_backup(LABEL)中指定的标签。

    5、此时你可能有疑问,为什么checkpoint的检查点的位置保存在了backup_label,而不是我们已知的pg_control里?

    因为数据库的备份时间可能很长的,期间可能会多次执行常规checkpoint,如果放在pg_control里,那这个位置就可能会常规checkpoint被覆盖了。

    6、pg_stop_backup做了什么?

    pg_stop_backup主要完成以下工作:

    • 如果pg_start_backup强制打开了full_page_write,pg_stop_backup将会将其重置为非全页写模式。

    • 创建备份历史文件(timeline.hostory)。

    • 删除backup_label文件。(注:从基础备份恢复时,需要backup_label文件,其被复制到归档目录之后,在原始数据库集中就不再需要了。)

    7、什么是数据库归档?

    一般情况下,PostgreSQL数据库将wal文件保存在$PGDATA的pg_wal下。但是这些wal文件可能会被回收。为了避免这种情况,我们可以将wal文件的副本保存在除$PGDATA之外的单独目录中。在PG中,将wal文件复制到其他位置被称为归档(让服务器读取wal文件并应用它称为恢复)。

    8、怎么开启归档?

    在pg中开启归档,依赖三个配置:archive_mode、archive_command和wal_level

    • archive_mode:表示是否要启用wal归档。

    • archive_command:指定如何归档。此选项接受shell命令或shell脚本。

    • wal_level:可选项:

      • Minimal:只添加崩溃服务或立即关闭所需的信息。它不能用于复制或归档目的。

      • Replica: 表示wal将有足够的信息用于wal归档和复制。

      • Logical:添加逻辑复制所需的信息。

                

    一个配置示例:

      archive_mode = on
      archive_command = ‘cp %p path/to//archive_dir/%f’
      wal_level = replica

      其中:

      %p: 被替换为WAL文件的路径名。

      %f: 被替换为WAL文件的文件名。

      9、怎么做PITR(按时间点恢复)?

      PITR工作需要两个重要的先决条件:

      • 基础备份的可用性。

      • 连续归档日志。

      有了这两个为前提,然后需要配置restore_command和recovery_target选项。

      示例:

        # Place archive logs under mnt/server/archivedir directory.
        restore_command = 'cp mnt/server/archivedir/%f %p'
        recovery_target_time = "2021-5-10 12:05 GMT"

        restore_command:指定从何处查找要在该服务器上重播的WAL文件。这个命令接受与archive_command相同的占位符。

        recovery_target_time:该选项告诉服务器何时停止恢复或重放进程。一旦到达给定的时间戳,进程就会停止。

        注:pg11.0以及之前,这两个参数在recovery.conf中进行设置。pg12.0以及之后在postgresql.conf中进行配置(12.0已经废除了recovery.conf,所有与recovery相关的参数都移到了postgresql.conf中)。除此之后,在版本12或更高版本中,当进行恢复时,还需要创建一个名为recovery.signal的空文件。

        10、PITR的工作流程?

        (1)PostgreSQL从backup_label文件中读取CHECKPOINT LOCATION的值,即REDO点。

        (2) PostgreSQL从recovery.conf(版本11或更早)或PostgreSQL .conf(版本12或更高)中读取restore_command和recovery_target_time参数值。

        (3) PostgreSQL从REDO点开始重放WAL数据,通过参数resotere_command,从归档日志中读取WAL数据,将归档日志从归档区复制到临时区。(临时区域中复制的日志文件使用后会被删除。)

        注:如果没有配置recovery_target_time,PG将重放日志直到归档结束。

        (4)恢复过程结束后,生成时间线历史文件,如00000002.History,该文件被创建在pg_xlog子目录(在版本10或更高版本,pg_wal子目录),如果启用了归档日志特性,归档目录下也会创建相同的命名文件。

        11、PITR与正常的数据库恢复有何不同?

        正常恢复模式是从base目录下的pg_wal目录中获取wal文件,而PITR模式是从archive_command中设置的归档目录中获取。

        正常恢复模式从pg_control文件获取检查点位置,而PITR模式从backup_label文件中获取检查点位置。

        12、什么是时间线?什么时间线历史文件?

        PG中的时间线用于区分原始的数据库集群和恢复后的数据库集群,是PITR的核心概念。

        每个数据库集群分配一个单独的timelineId。initdb实用程序创建的原始数据库集群的timelineId为1。当数据库集群恢复时,timelineId将增加1。

        当我们启动PostgreSQL服务器时,初始时间线被设置为1,从pg_start_backup创建的REDO点到恢复目标,在归档日志中回放WAL数据,然后,一个新的timelineId 2被分配给恢复的数据库集,PostgreSQL将在新的时间线2上运行。如下图所示:

        图片来源:https://www.interdb.jp/pg/pgsql10.html

        前面提到,当一个PITR进程完成时,会生时间线历史文件。这个文件的命名规则为:

        “8位的新timelineid.history”,比如此例中,就是00000002.history。

        该文件的内容:

          postgres> cat home/postgres/archivelogs/00000002.history
          1 0/A000198 before 2021-5-10 12:05:00.861324+00

          第一列:timelineId—timelineId用于恢复的归档日志的id。

          第二列:LSN WAL段发生切换的位置。





          参考:https://www.interdb.jp/pg/pgsql10.html

          https://www.postgresql.org/docs/9.1/continuous-archiving.html

          文章转载自PostgreSQL运维技术,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

          评论