暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

如何使用pgloader迁移MySQL数据库至openGauss

Gauss松鼠会 2021-09-15
1293

Gauss松鼠会

学习 探索 分享数据库前沿知识和技术 共建数据库技术交流圈

关注

pgloader介绍

pgloader是一个数据导入工具,使用COPY命令将数据导入到PostgreSQL。pgloader有两种工作模式,一种是从文件导入,一种是迁移数据库。pgloader在两种情况下都使用PostgreSQL的COPY协议高效的传输数据。

openGauss兼容PostgreSQL的通信协议以及绝大部分语法,可使用pgloader将MySQL数据库迁移至openGauss。

pgloader在openGauss上的问题

由于openGauss 对原生PostgreSQL的通信协议进行了安全加固,这导致与PostgreSQL的默认通信协议互相不兼容了,因此,使用pgloader的PostgreSQL原生版本默认是不能连接openGauss的。会报类似下述错误:

处理方式是通过修改GUC进行规避,涉及的GUC参数是password_encryption_type,PostgreSQL默认的加密方式是md5,由于md5已经不安全了,为了提高openGauss的安全能力,openGauss支持sha256, 并且默认是sha256的加密方式,这就导致了上述报错。但是openGauss并没有删除md5的加密和验证逻辑,因此,是可以通过修改该GUC参数开启md5加密方式的。

开启方法:

    gs_guc reload -D $PGDATA -c "password_encryption_type = 1"

    一定要在设置完上述参数后,再新建用户。然后就可以使用该新建用户登录数据库了。

    接下来我们将演示如何使用pgloader迁移MySQL数据库至openGauss。

    安装pgloader

    您可以直接从 apt.postgresql.org 和官方 debian 存储库 packages.debian.org/pgloader 安装 pgloader。

      $ apt-get install pgloader

      同时,您也可以通过 docker image 使用pgloader。

        $ docker pull dimitri/pgloader
        $ docker run --rm --name pgloader dimitri/pgloader:latest pgloader --version
        $ docker run --rm --name pgloader dimitri/pgloader:latest pgloader –help

        配置pgloader

        pgloader提供丰富的配置项,您可以自由定义迁移时的各类动作,如通过include drop,删除目标数据库中名称出现在MySQL数据库中的所有表,以允许连续多次使用同一命令,从干净的环境自动启动。

        这里简单介绍几个常用的配置项。

        FROM:源数据库的连接URL,格式如下:

            mysql://[user[:password]@][netloc][:port][/dbname][?option=value&...]

          INTO:目标数据库的连接URL,格式如下:

              postgresql://[user[:password]@][netloc][:port][/dbname][?option=value&...]

            WITH:从MySQL数据库加载时的选项。有include drop、create tables、create indexes等选项。

            CAST:用户自定义类型转换规则。允许用户覆盖已有的默认转换规则或者使用特殊情况修改它们。

            部分迁移:用户可以通过 including only table names matching 和 excluding table names matching 实现只迁移特定的表或者在迁移过程中排除特定的表。

            详细的配置项解读,可查看官网的说明:

            https://pgloader.readthedocs.io/en/latest/ref/mysql.html

            下面是一份从MySQL迁移到openGauss的配置文件示例:

            LOAD DATABASE

            FROM mysql://mysql_test:password123@1.1.1.1:3306/mysql_database

            INTO postgresql://opengauss_test:password_123@1.1.1.1:5432/opengauss_database

            WITH include drop, create tables, create indexes, reset no sequences,

            workers = 8, concurrency = 1,

            multiple readers per thread, rows per range = 50000

            CAST

            type varchar when(= 1 precision) to "boolean" drop typemod keep default keep not null;

            以上配置文件的含义是,迁移数据时,MySQL侧使用的用户名密码分别是 mysql_test 和 password123。MySQL服务器的IP和port分别是1.1.1.1和3306,待迁移的数据库是mysql_database。

            openGauss侧使用的用户名密码分别是 opengauss_test 和 password_123。openGauss服务器的IP和port分别是1.1.1.1和5432,目标数据库是opengauss_database。

            需要注意的是,这里使用的用户需要有远程连接MySQL和openGauss的权限,以及对对应数据库的读写权限。同时对于openGauss,运行pgloader所在的机器需要在openGauss的远程访问白名单中。

            创建用户及database

            在openGauss侧创建迁移时需要用到的用户以及database。

            运行pgloader进行数据迁移

            以下演示基于使用docker image方式安装的pgloader。将前面准备好的配置文件命名为 openGauss.loader。

              启动docker:docker run -tid --name pgloader_test dimitri/pgloader
              复制配置文件到docker:docker cp ./openGauss.loader pgloader_test:/
              进入docker环境:docker exec -it pgloader_test bin/bash

              启动pgloader,等待数据迁移完成,查看迁移结果报告:pgloader openGauss.loader

              在openGauss侧查看迁移结果:

              END
              Gauss松鼠会
              汇集数据库从业人员及爱好者
              互助解决问题 共建数据库技术交流圈

              文章转载自Gauss松鼠会,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

              评论