Oracle关于大字段对象表的迁移(数据泵).docx

逆风飞翔

1044

10页

100次

2023-02-17

免费下载

我们在数据库日常运维过程中，经常会使用数据泵

datapump(expdp\impdp)

对数据

库做导出导入操作，从而实现数据库的部分或全量数据迁移

(

如搭建测试库、迁移生

产库、合并数据库等

)

。

然而在数据的导出导入过程中，我们会发现比较大的大字段表会很影响整个导出导

入效率，甚至无法正常完成。普通表我们可以采取加并行参数

(parallel)

来提升导出

导入效率，但此参数针对于大字段表是无效的，即使加了并行参数，大字段表还是

单进程执行导出导入操作。

下面让我通过一个案例来说明要如何使用数据泵来迁移大字段表。

一、背景

有套业务子库

(

大小大概

2T)

需要迁移合并至其业务主库，由于是合并操作，在排除

使用

ADG

、

XTTS

、

OGG

等迁移方案之后，考虑采用数据泵导出导入的方式进行合并

迁移。整个合并迁移时间（包括数据库迁移合并

业务测试）限制在

小时以内，数

据库中大部分表通过并发导出导入等优化方式可以在

小时内完成，唯独有一张包

含

200

多

大字段对象的表仅仅是导出花费十几个小时也未完成，直至报错

(

报快照

过久

)

。通过扩展

undo

表空间及调整参数

undo_retenon

，最终还是导出失败。

二、分析原因

LOB

字段的表导出时即使加并行参数也是无效的，还是单进程在导出表数据，表本

身包含

220G

数据，大字段数据就占

202G

，数据量比较大，加上源端服务器是普通

的

X86

服务器，数据在导出过程中还会发生变化，最终由于耗时过久，导出失败。

三、解决问题

数据库总共有

数据，其他

1.8T

数据通过开并行等手段基本可以在

小时之内导

出完成，唯独此大字段表即使导出十几个小时也无法正常完成，所以首先我们要尝

试解决并行的问题，通过一定的手段使大字段表的导出能够并发进行。

既然并行参数

parallel

对大字段表是无效的，在不改变表结构及数据的情况下，我

们可以尝试将表从逻辑上拆分成一个一个的小单位，每个小单位拉起一个导出进程，

这样就可实现大字段表的并行导出操作。

那如何逻辑拆分大字段表呢？如果表上有日期字段，我们可以按日期字段拆分表，

再如表上有区域字段，我们也可以按区域字段做拆分，即使没有特别明显的可以区

分数据的字段，我们也可以按

rowid

去做拆分。

其实按

rowid

去做拆分是一个很好的方式，因为

oracle

做数据插入时是无序插入的

(

同一时刻多个进程对同一张表做插入，数据可能存放在不同的数据块上，并不是一

个数据块使用完之后，再插入新的数据块

)

，但了解

oracle

存储结构的会知道，如果

我们不管数据的组成，

rowid(rowid

是由对象编号

文件号

数据块编号

行号组成

)

其

实是有序的，我们如果按

rowid

有序的去做拆分，就可以尽量少读数据块

(

相较于索

引扫描及全表扫

)

，从而提升整个导出效率。

准备工作：首先我们创建一张中间表，将表数据的

rowid

按顺序记录下来

(

全表扫有

序读取相邻的数据块

)

，方便之后做拆分

create table t_test_split as select /*+parallel(4)*/rowid sou_rowid,rownum rn,(select current_scn from

v$database) scn from t_test;

虽然合并迁移过程中业务子库是停业务不再读写的，但为了保证数据的一致性，我

们还是选择把数据库的

scn

号记录下来。例如在数据库不停机的情况下，你在搭建

OGG

环境初始化大字段表时，这里保存的

scn

号就非常有用了。

正式执行导出导入：源库拉起导出主进程，通过

rowid

将表拆分成一个一个的小单

元，每个小单元拉起一个独立子进程单独导出一部分表数据，子进程导出完成生成

一个标记文件用来标记子进程已导出完成。目标库拉起导入的主进程，监控导出的

of 10

免费下载

关注

评论