暂无图片
oracle ASM磁盘组一个磁盘offline问题,如何找到对应的哪块盘并修复?
我来答
分享
在路上
2025-04-08
oracle ASM磁盘组一个磁盘offline问题,如何找到对应的哪块盘并修复?

环境信息:oracle asm存储用的是一体机的cell节点里的存储。以下为排查思路,哪位帮忙看下具体怎么处理?

1.通过asmcmd  lsdg检查发现catalog磁盘组有一个offline_disks=1

2.检查votedisk也有一个offline的磁盘,但是没有对应到具体磁盘组的路径,路径怎么查?

3.执行lsop有相关任务活动

4.检查v$asm_disk,cell是3节点做的3个failgroup,每个查询catalog所在磁盘组磁盘信息如下

总共是33个记录,每个cell是10个griddisk,2个quorum,1个名字为_DROPPED_0009_CATALOG状态下线,但是没有具体的路径,不知道对应哪个磁盘?检查cell节点也都是10个catalog_cd开头的griddisk,查询都是存在的,这个offline的应该怎么找?

5.现在的问题是如何找到对应offline所在磁盘路径,然后怎么重新加入磁盘组,感谢各位大佬帮忙看看

我来答
添加附件
收藏
分享
问题补充
8条回答
默认
最新
ora_221

三个存储节点都查一下griddisk状态:

cellcli -e list griddisk attributes name,asmmodestatus,asmdeactivationoutcome

还有存储错误日志查了吗?#cellcli -e list alerthistory

暂无图片 评论
暂无图片 有用 0
暂无图片
陌上

查asm日志可以查到是什么时候踢的

暂无图片 评论
暂无图片 有用 0
在路上
题主
2025-04-08
NOTE: initial disk modes for disk 9 () in group 1 (CATALOG) is not completely online: modes 0x1 lflags 0x0 SQL> alter diskgroup catalog offline disk '_DROPPED_0009_CATALOG' SUCCESS: alter diskgroup catalog offline disk '_DROPPED_0009_CATALOG' WARNING: Disk 9 in group 1: state 0x6 mode 0x1 cannot be onlined WARNING: Disk 9 in group 1: state 0x6 mode 0x1 cannot be onlined 搜索历史的asm日志有这个记录,难道这个磁盘组就叫这个dropped名字?这个感觉是手动操作的?
陌上
答主
2025-04-09
继续往前查,肯定有个日志是刚刚offline的的
R
reddey

如果你用的是EXADATA一体机,应该进入一体机查看相应磁盘路径。

暂无图片 评论
暂无图片 有用 0
在路上
题主
2025-04-08
exadata里list查看 celldisk,griddisk,lun这些都没有具体的磁盘路径
JiekeXu
暂无图片

我没有使用过一体机,这个存储路径不知道是通过什么多路径软件生成的,问问系统工程师。
或则你直接用 oracle 自带的 kfod 命令试试。

https://www.modb.pro/db/44696

kfod disks=all status=true

kfod status=TRUE asm_diskstring='/dev/rhdisk*' disks=ALL
暂无图片 评论
暂无图片 有用 2
在路上
题主
2025-04-08
好的,谢谢 我试试看有没有,一体机应该是一个物理硬盘对应一个celldisk,然后celldisk 划分多个griddisk,用作磁盘组的
ora_221

1.外观查看一体机存储节点硬盘是否有亮故障灯


2.存储系统查询

ssh <存储节点IP>

#cellcli -e list physicaldisk    //查询存储盘及状态信息

--正常状态如下:

 8:0               xxxxx                 normal
8:1 xxx                 normal
...
FLASH_1_1 xxxx     normal
....

#cellcli -e list alerthistory //存储节点alert日志


以上可以找到对应的故障硬盘,注意:故障盘是0或1号盘需注意!

暂无图片 评论
暂无图片 有用 0
在路上
题主
2025-04-09
这个查看硬盘是正常的,12块硬盘正常,4块闪存盘,有一个flash 闪存盘提示warning-predictive failure,这个报警应该和asm哪个offline磁盘没有关系,asm磁盘用的是ssd硬盘。不是闪存。
ora_221
暂无图片 评论
暂无图片 有用 0
ora_221

你从哪里查的asm没有使用flash卡

暂无图片 评论
暂无图片 有用 0
在路上
题主
2025-04-09
感谢回答,评论无法截图,我单独截图了请看下面。这个故障的flash卡没有被用到。用的是另外3个flash卡,这个flash报警是不是和asm磁盘offline没有关系?因为我看你发的查看cell错误日志有ora-15041应该是磁盘组空间不足的报错
在路上

fd_01_za01celadm02闪存盘告警,griddisk相关用的闪存是另外3块flash卡

下面是三个存储节点的griddisk状态,其中告警这台显示都是正常的,另外两台显示有问题,大概意思是由于那个offline的磁盘导致的

错误日志如下:大概是无法重平衡这个磁盘组

暂无图片 评论
暂无图片 有用 0
ora_221
2025-04-09
griddisk状态看起来是正常的,你那个offline正好在存储2#节点上,好好检查下2#存储,可能和flash卡有关联,还有查一下2#存储8:6硬盘
回答交流
提交
问题信息
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏