暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据库迁移怎么破?MySQL到南大通用GBase 8c迁移方案来啦

GBASE数据库 2025-02-27
203


在数字化浪潮席卷而来的今天,出于系统架构、成本以及业务的考量,越来越多企业用户需要完成异构数据库间的适配迁移。南大通用GBase 8c数据库作为第三代智能化数据库产品,具有多模多态、弹性伸缩、强一致性分布式事务等产品特性,能够承载企业海量的数据;将繁重工作负载分配到多台服务器上并行处理,提高系统的吞吐量和响应速度,提供更高的性能、容错性和可靠性。


同时GBase 8c具备高兼容性,提供全套完备的数据迁移方案与工具,实现不同数据库至GBase 8c的平滑迁移。本文以MySQL数据库迁移至GBase 8c数据库为例,介绍迁移工作中的关键步骤。




迁移前的关键准备工作




环境评估与兼容性分析


(1)根据源库特征,来选择GBase 8c目标库兼容模式。本文以MySQL为源库,则目标库应选择B兼容模式,在创建database时指定。


(2)校验对象兼容性,重点检查源库的存储过程、触发器、自定义函数等高级特性,例如MySQL的“ENUM”类型和“TINYINT”已实现原生兼容 。


(3)字符集适配。


需要注意的是GBase 8c默认字符集为“SQL_ASCII”,在创建库时需要显式设置“UTF8MB4”以匹配MySQL标准。


综上因素,创建目标库的database。例如创建mytest库,指定兼容模式为B、设置字符集,执行命令:


    CREATE DATABASE mytest WITH DBCOMPATIBILITY='B' ENCODING='UTF8MB4';


    对目标库再次确认兼容模式,执行命令:


      SELECT datname,datcompatibility FROM pg_database;


      2. 迁移工具选型策略 


      GBase 8c自带的命令行工具链,适用于迁移自动化流水线场景,包含gs_dump逻辑导出工具与gsql数据加载工具等。


      配套可视化工具DMT,采用B/S架构,支持Docker一键部署,提供数据迁移、数据同步、数据校验三大核心功能模块。




      迁移实施核心步骤详解  




      1. 数据库对象迁移 


      (1)表结构转换  


      通过mysqldump --no-data导出DDL脚本后,GBase 8c可直接执行90%以上的MySQL建表语句。


      特殊处理场景例如: 


      • 时间精度处理:根据是否有时区,将DATETIME(6)转换为TIMESTAMP(6) WITH TIME ZONE或TIMESTAMP(6) WITHOUT TIME ZONE


      • 索引优化:分布式环境下建议采用哈希分布键替代B树索引


      (2)存储过程迁移


      该对象可能需要进行语法转换,例如:


      MySQL原语句为:


        DELIMITER 
        CREATE PROCEDURE get_users()
        BEGIN
        SELECT * FROM users;
        END
        DELIMITER ;


        GBase 8c适配后语句转换:


          CREATE OR REPLACE PROCEDURE get_users()
          LANGUAGE plpgsql
          AS $$
          BEGIN
          RETURN QUERY SELECT * FROM users;
          END;
          $$;


          2. 数据迁移实施


          使用MySQL自带的工具进行数据导出,例如执行:


            mysqldump -u root -p --single-transaction --databases db1 > full_backup.sql


            数据导出到full_backup.sql文件中。


            GBase 8c进行数据加载,例如执行:


              gsql -d target_db -p 15400 -f full_backup.sql  


              将full_backup.sql文件中数据进行导入。


              建议:TB级数据采用分片并行加载策略以提升吞吐量




              典型问题与解决方案 




              1. 字符集冲突  


              例如在迁移时出现错误:ERROR: could not determine collation for view column。


              根据错误提示可了解到是由于未指定字符集。


              解决方法:


              显式指定COLLATE utf8mb4_general_ci,执行:

                CREATE VIEW v1 AS SELECT col1 COLLATE "utf8mb4_general_ci" FROM tbl1;


                2. 分布式事务优化  


                在迁移时,如果出现跨节点UPDATE语句性能下降的问题。


                解决方法:

                • 启用SET dolphin.b_compatibility_mode = on,开启dolphin兼容性插件,以提升语法兼容性


                • 采用HASH分布优化数据局部性


                3. 函数兼容性处理


                假如在迁移时出现STR_TO_DATE返回值类型不匹配的问题。


                解决方法:


                添加显式类型转换,例如执行:


                  SELECT (STR_TO_DATE('2023-01-01', '%Y-%m-%d')::timestamp) + INTERVAL '1 day';




                  迁移后验证




                  在数据迁移完成后需要对其进行校验,确保数据的完整性和准确性,可以通过以下方式进行验证:


                  • 比对表行数:比较MySQL和GBase8c中每个表行数是否一致。


                  • 随机抽样:随机抽取一部分数据,收到验证数据的一致性。


                  • 检查外键约束和索引:确保所有外键约束和索引都已正确迁移。



                  本期供稿 | 分布式事务产品经营部

                  本期编辑 | Suse

                  内容审核 | 生态发展部



                  最后修改时间:2025-02-27 14:33:27
                  文章转载自GBASE数据库,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

                  评论