暂无图片
暂无图片
1
暂无图片
暂无图片
暂无图片

国产数据库KingBase初探----逻辑导出与导入

[TOC]

一、导读

KingBase数据库是人大金仓的一款典型的集中式国产数据库,它的使用方法和开源的postgreSQL整体比较相似。根据官方描述,KingBase能够提供很多便捷的数据迁移工具,将数据从异构、同构数据库中实现无损、快速的数据迁移。本次由于项目上的需求,我们需要将SIT环境的KingBase数据迁移至UAT环境(对UAT环境进行覆盖)。

UAT环境是开发人员做历史性能测试用的数据库,在上层应用进行更新后,我们需要将数据库的数据随即同步过去,由于对数据需求的时间没有严格要求,因此选择使用逻辑的方式进行导出导入覆盖UAT数据库。
在KingBase数据库中,逻辑导出和导入主要是用了两个命令,分别为:sys_dump、sys_restore(这里需要另外说一下,如果我们导出了sql文本,那么也可以通过ksql执行文本的方式进行导入)。

在进行导出和导入前,可以先了解下sys_dump和sys_restore的一些参数,方便我们进行选择,我们可以通过sys_dump --help和sys_restore --help进行查看(整体和postgreSQL一样,具体参数放在最后吧)。

二、需求描述

经过调研,本次迁移环境在sit环境中,有三个数据库,分别为dba_sit、dbb_sit、dbc_sit三个数据库,数据库的所属用户为usera_sit、userb_sit、userc_sit,数据库使用的schema也与用户相同,但是usera_sit的表都在public的schema下。

而在uat环境中,同样也需要三个数据库,分别为dba、dbb、dbc,数据库所属用户为usera、userb、userc,数据库使用的schema与用户相同,且所有表都在各自的schema下。

迁移前后状态具体如下:

数据库 user schema table_owner table_schema
dba_sit usera_sit usera_sit usera_sit public
dbb_sit userb_sit userb_sit userb_sit public
dbc_sit userc_sit userc_sit userc_sit public

迁移后
===>

数据库 user schema table_owner table_schema
dba usera usera usera usera
dbb userb userb userb userb
dbc userc userc userc userc

这里可以看到,我们需要重点做的两个转换,一是将用户table_owner由usera_sit(userb_sit、userc_sit)转换为usera(usera、userb、userc),二是将对象所属的schema由public转换为usera(userb、userc)。

三、迁移过程

由于在之前uat环境曾被做过测试,因此首先我们需要清理uat数据库。当直接drop database dba的时候,出现报错:

ERROR: database "dba" is being accessed by other users
描述:There are 60 other sessions using the database

这里很明显可以看,由于数据库仍然有客户端连接,所以无法删除。
出现这种情况解决办法无非就是从应用、数据库本身两个方面解决。在oracle数据库中,监听是一个独立的进程,所以dba往往会手动关闭监听,杀死LOCAL=NO的会话,从而结束旧连接,拒绝新连接。

而在人大金仓(或者postgreSQL数据库中),我们则可以通过select sys_terminate_backend(pid)方式对旧连接强制关闭,用sys_hba.conf(pg_hba.conf)对连接的限制进行策略设置来拒绝新的连接。

vi /data/sys_hba.conf,加入以下内容:

host    dba     all     0.0.0.0/0       reject
host    dbb     all     0.0.0.0/0       reject
host    dbc     all     0.0.0.0/0       reject

重新加载配置:

/kingbase/Cluster/kingbase/bin/sys_ctl -D /data reload

登录数据库,生成语句批量结束旧会话:

ksql dba usera

select concat('select sys_terminate_backend(',pid,');') from sys_stat_activity where datname in('dba','dbb','dbc');

删除旧数据库:

drop database dba;
drop database dbb;
drop database dbc;

重新创建新的数据库,并指定owner为usera,创建同名schema:

ksql test system
create database dba owner usera;
\c dba usera
create schema usera;

导出数据:

sys_dump -U usera_sit -v dba_sit -Fd -f exp_dba_sit.dump

其中,
-U 表示导出时候连接的用户
-v 表示现实详细过程
-F 指定备份文件格式,分为p(plain)表示纯文本形式的SQL,c(custom)表示自定义模式,d(目录)表示生成一个数据归档目录,t(tar)表示生成一个tar包
-f 表示输出到文件或者目录中,如果不加该参数则会标准输出(也就是说如果-F使用了d的参数生成目录,则必须使用-f参数)
-O 表示导出的时候不导出数据库对象的所属关系,但是这个参数只对默认的sql生效,即-F指定了p格式(在导出时没有使用,是因为我们采用了目录格式,所以不生效)

导入数据:

sys_restore -U usera -g public -G usera -O -v -d dba exp_dba_sit.dump

其中,
-U 表示导入时候连接的用户
-g 表示源数据所属的schema
-G 表示导入数据所属的schema
需要注意的是,这两个参数需要同时使用;整体效果类似于oracle数据库expdp中的remap_schema,在导入的时候我们则通过这两个参数将原来库中的public模式转换成usera模式
-O 表示不带入导出时的的用户,导入时候的-U参数指定的用户则成为对象的owner,最终达到我们想要的用户转换。
-v 表示显示详细的导入过程。
此外,还有两个参数,在导入的时候也有一些用处,
-c 表示在重新创建对象前会清除,重新导入,类似于oracle中expdp的table_exist_actions,这个参数可以让我们导入的时候可以反复重新导入
-C 表示在恢复数据库前创建这个数据库,需要注意的事,它无法跟进参数,所以重建的数据库应该是和导出的一致。

附 kingbase导出导入的参数

sys_dump 把一个数据库转储为纯文本文件或者是其它格式.

用法:
  sys_dump [选项]... [数据库名字]

一般选项:
  -f, --file=FILENAME          输出文件或目录名
  -F, --format=c|d|t|p         输出文件格式(c为定制,d为目录,t为tar,p为明文(默认值))
  -v, --verbose                详细模式
  -V, --version                输出版本信息,然后退出
  -Z, --compress=0-9           被压缩格式的压缩级别
  -j, --jobs=NUM               执行多个并行任务进行备份转储工作
  -K, --key=encryptkey         加密密钥
  --lock-wait-timeout=TIMEOUT  在等待表锁超时后操作失败
  --no-sync                    不用等待变化安全写入磁盘
  -?, --help                   显示此帮助, 然后退出

控制输出内容选项:
  -a, --data-only              只转储数据,不包括模式
  -b, --blobs                  在转储中包括大对象
  -B, --no-blobs               排除转储中的大型对象
  -c, --clean                  在重新创建之前,先清除(删除)数据库对象
  -C, --create                 在转储中包括命令,以便创建数据库
  -E, --encoding=ENCODING      转储以ENCODING形式编码的数据
  -n, --schema=PATTERN         只导出指定的模式
  -N, --exclude-schema=PATTERN 不导出指定的模式
  -O, --no-owner               在明文格式中, 忽略恢复对象所属者
  -s, --schema-only            只转储模式, 不包括数据
  -S, --superuser=NAME         在明文格式中使用指定的超级用户名
  -t, --table=PATTERN          只导出指定表
  -T, --exclude-table=PATTERN  不导出指定表
  -x, --no-privileges          不要转储权限 (grant/revoke)
  --binary-upgrade             只能由升级工具使用
  --column-inserts             以带有列名的INSERT命令形式转储数据
  --copy-binary                以二进制拷贝方式导出数据
  --disable-dollar-quoting     取消美元 (符号) 引号, 使用 SQL 标准引号
  --disable-triggers           在只恢复数据的过程中禁用触发器
  --enable-row-security        启用行安全性(只转储用户能够访问的内容)
  --exclude-table-data=PATTERN 不导出特定表数据
  --extra-float-digits=NUM     覆盖extra_float_digits的默认设置
  --if-exists                  当删除对象时使用IF EXISTS
  --include-all-partitions[=OPT]
                               转储分区表的所有分区
  --inserts                    以INSERT命令,而不是COPY命令的形式转储数据
  --load-via-partition-root    通过根表加载分区
  --no-security-labels         不转储安全标签的分配
  --no-subscriptions           不转储订阅
  --no-synchronized-snapshots  在并行工作集中不使用同步快照
  --no-tablespaces             不转储表空间分配信息
  --no-unlogged-table-data     不转储没有日志的表数据
  --no-comments                不转储注释
  --no-publications            不转储发布
  --on-conflict-do-nothing     将ON CONFLICT DO NOTHING添加到INSERT命令
  --parallel-lob-data          并行导出lob表
  --quote-all-identifiers      所有标识符加引号,即使不是关键字
  --rows-per-insert=NROWS      每个插入的行数;意味着--inserts
  --serializable-deferrable    等到备份可以无异常运行
  --snapshot=SNAPSHOT          为转储使用给定的快照
  --strict-names               要求每个表和(或)schema包括模式以匹配至少一个实体
  --section=SECTION            备份命名的节 (数据前, 数据, 及 数据后)
  --use-set-session-authorization
                               使用 SESSION AUTHORIZATION 命令代替
                               ALTER OWNER 命令来设置所有权

联接选项:
  -d, --dbname=DBNAME      对数据库 DBNAME备份
  -h, --host=主机名        数据库服务器的主机名或套接字目录
  -p, --port=端口号        数据库服务器的端口号
  -U, --username=名字      以指定的数据库用户联接
  -w, --no-password        永远不提示输入口令
  -W, --password           强制口令提示 (自动)
  --role=ROLENAME          在转储前运行SET ROLE

如果没有提供数据库名字, 那么使用 KINGBASE_DATABASE 环境变量的数值
报告错误至 <kingbase-bugs@kingbase.com.cn>.







sys_restore 从一个归档中恢复一个由 sys_dump 创建的 Kingbase 数据库.

用法:
  sys_restore [选项]... [文件名]

一般选项:
  -d, --dbname=名字        连接数据库名字
  -f, --file=文件名        输出文件名(-为输出到stdout)
  -F, --format=c|d|t       备份文件格式(应该自动进行)
  -l, --list               打印归档文件的 TOC 概述
  -v, --verbose            详细模式
  -V, --version            输出版本信息, 然后退出
  -?, --help               显示此帮助, 然后退出

恢复控制选项:
  -a, --data-only              只恢复数据, 不包括模式
  -c, --clean                  在重新创建之前,先清除(删除)数据库对象
  -C, --create                 创建目标数据库
  -e, --exit-on-error          发生错误退出, 默认为继续
  -E, --skip-errors            跳过COPY时遇到的错误行
  -I, --index=NAME             恢复指定名称的索引
  -j, --jobs=NUM               执行多个并行任务进行恢复工作
  -K, --key=encryptkey         指定加密密钥
  -L, --use-list=FILENAME      从这个文件中使用指定的内容表排序输出
  -n, --schema=NAME            在这个模式中只恢复对象
  -N, --exclude-schema=NAME    不恢复此模式中的对象
  -g, --fromSchema=NAME        恢复来自这个模式的对象,和-G一同使用
  -G, --toSchema=NAME          把对象恢复到这个模式,和-g一同使用
                               目标模式和源模式的的数目应相同,或者只有一个目标模式
  -O, --no-owner               不恢复对象所属者
  -P, --function=NAME(args)    恢复指定名字的函数
  -s, --schema-only            只恢复模式, 不包括数据
  -S, --superuser=NAME         使用指定的超级用户来禁用触发器
  -t, --table=NAME             恢复命名关系(表、视图等)
  -T, --trigger=NAME           恢复指定名字的触发器
  -x, --no-privileges          跳过处理权限的恢复 (grant/revoke)
  -1, --single-transaction     作为单个事务恢复
  --from-schema-case-sensitive 指定源模式区分大小写,默认不区分大小写
  --view-only                  仅恢复此视图
  --recreate-view              最后重新创建视图
  --disable-triggers           在只恢复数据的过程中禁用触发器
  --enable-row-security        启用行安全性
  --if-exists                  当删除对象时使用IF EXISTS
  --no-comments                不恢复注释
  --no-data-for-failed-tables  对那些无法创建的表不进行
                               数据恢复
  --no-publications            不恢复发行
  --no-security-labels         不恢复安全标签信息
  --no-subscriptions           不恢复订阅
  --no-tablespaces             不恢复表空间的分配信息
  --section=SECTION            恢复命名节 (数据前、数据及数据后)
  --strict-names               要求每个表和(或)schema包括模式以匹配至少一个实体
  --use-set-session-authorization
                               使用 SESSION AUTHORIZATION 命令代替
                               ALTER OWNER 命令来设置所有权

联接选项:
  -h, --host=主机名        数据库服务器的主机名或套接字目录
  -p, --port=端口号        数据库服务器的端口号
  -U, --username=名字      以指定的数据库用户联接
  -w, --no-password        永远不提示输入口令
  -W, --password           强制口令提示 (自动)
  --role=ROLENAME          在恢复前执行SET ROLE操作

选项 -n 和 -g(-G) 不能组合使用
选项 -I, -n/-g(-G), -P, -t, -T 以及 --section 可以组合使用和指定多次用于选择多个对象.

如果没有提供输入文件名, 则使用标准输入.

报告错误至 <kingbase-bugs@kingbase.com.cn>.
最后修改时间:2024-06-17 10:40:09
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论