暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Oracle坏块问题处理

扫地僧的故事 2020-07-30
3110
今天分享一个挺有意思的Oracle坏块处理的案例。(不熟悉oracle的小伙伴,就不用继续往下翻了哦~)
某天,数据库中出现了报错,ORA-01578: ORACLE data block corrupted。并且此数据库无备份,并不能直接用blockrecover,那如果是你,会怎么处理呢?
一、校验坏块
通过rman命令:backup validate check logical database;做一个全库的坏块校验(只是检查坏块,不会真的做备份),查看v$database_block_corruption(displays information about database blocks that were corrupted after the last backup),找到了93号文件中的6个坏块,坏块方式为FRACTURED(被截断)

CORRUPTIO有以下几种类型:
(1)ALL ZERO:Block header on disk contained only zeros. The block may be valid ifit was never filled and if it is i
(2)FRACTURED:Block header looks reasonable, but the front and back of the blockare different versions.           
(3)CHECKSUM:optional check value shows that the block is not self-consistent.It is impossible to determine exactl
(4)CORRUPT:Block is wrongly identified or is not a data block (for example,the data block address is missing)    
(5)LOGICAL:Specifies the range is for logically corrupt blocks.CORRUPTION_CHANGE# will have a nonzero value.    

二、继续追踪坏块

1.通过查询坏块的block号,得知坏块在lob段上,和lob段所在的表。

2.查看坏块的dumpfile

对坏块(1583564,1583566)进行dump。

alter system dumpfile file 93 block 1583564;

alter system dumpfile file 93 block 1583566;

由上图可知,坏块的frmt,type和tail的一一对应,并没有被破坏。结合坏块的方式为FRACTURED,分析造成坏块的可能原因:oracle的bock size=8K,当系统发生i/o以最小单位4kb写入lob所在的块时,第一次i/o已经写入4K,而下一次i/o并没有正常的写入该块,于是产生了坏块。

3.尝试跳过坏块,保留数据

既然坏块的数据无法恢复,那么为了让库正常的运行和后续的迁移,接下来需要把好的数据保留下来。

方法一:设置'10231'事件,跳过坏块

sql>alter system set events '10231 trace name context forever,level 10';    
由于坏块所在位置属于lob,该lob字段所在的表中的数据块是正常的,而10231事件并不会跳过lob的坏块。所以在执行第二步insert或expdp时会报错:
ORA-01555: snapshot too old: rollback segment number  with name "" too small
ORA-22924: snapshot too old 
通过查询mos文档(Doc ID 452341.1)可知:The cause of these errors could be a LOB corruption. Maintaining the LOBs will solve the problem with Exp/Expdp.
并且文档给出了一个可以获取lob坏块的脚本,通过dbms_lob工具查询lob坏块的rowid。lob坏块所在的表是分区表,本次只对分区进行操作即可。   

方法二:排除lob坏块,保留有用数据

通过官方提供的脚本,可以收集到lob坏块的rowid。
为了防止访问数据时读取到坏块,我们可是使用sql查询时排除坏块的rowid的方式,将数据插入到新表中。命令如下:
sql> insert *+ append nologging parallel(t 8) */ into .my_t select * from xx.xx partition(PXXX) where rowid not in ('AAItGTABeAAPFzOAAM') ;
到这里,差不多问题就已经解决了,后面随便你drop还是truncate原表,只要把新表的数据搞过去就行啦~
如果这个时候,再去校验坏块,你觉得还会有坏块吗???


也没有评论功能,一个人在自言自语个啥。。
答案是:会的。不过对数据库本身并没有影响,最好呢,是再做一下坏块清理。
如果哪里写得有问题,给我留言哈,谢谢~
文章转载自扫地僧的故事,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论