暂无图片
分享
LEE
2020-04-24
系统重启分析
暂无图片 5M

系统执行perf top 无响应后,操作系统重启,排查系统日志发现可疑信息
multipathd: asm!.asm_ctl_vbg8: add path (uevent)
multipathd: asm!.asm_ctl_vbg8: failed to get path uid
multipathd: uevent trigger error
WARNING: Failed to send buffer
判断可能是多路径问题,这个能分析出什么原因导致多路径问题吗?

收藏
分享
9条回答
默认
最新
Moone

这几行信息说明有新路径加入asm,然后获取uid失败。
可能的原因很多,系统负载、osbug、多路径软件、存储都有可能。
系统reboot有没有crash日志呢,如果有可以分析。
如果有os监控也应看看故障前是否有异常。

暂无图片 评论
暂无图片 有用 0
LEE
上传附件:trace.txt
暂无图片 评论
暂无图片 有用 0
LEE

您看下这个呢
我查到一行有 (reboot关键字)
Apr 23 08:26:45 xxxxdb1 logger: exec /u01/app/11.2.0/grid/perl/bin/perl -I/u01/app/11.2.0/grid/perl/lib /u01/app/11.2.0/grid/bin/crswrapexece.pl /u01/app/11.2.0/grid/crs/install/s_crsconfig_xxxxdb1_env.txt /u01/app/11.2.0/grid/bin/ohasd.bin “reboot”

根据多路径的错误
multipathd: asm!.asm_ctl_vbg8: add path (uevent)
multipathd: asm!.asm_ctl_vbg8: failed to get path uid
multipathd: uevent trigger error
WARNING: Failed to send buffer

结合对应的mos 1417294.1
集群里面不是文档1417294.1里 的特性

暂无图片 评论
暂无图片 有用 0
lscomeon

这些日志都是重启过后的了,看不出来什么

暂无图片 评论
暂无图片 有用 0
LEE
上传附件:messages
暂无图片 评论
暂无图片 有用 0
LEE

我感觉8.23 7点到8点中间没日志 比较奇怪
您看看这个呢,数据库层面没有压力
基本确定是操作系统层面的问题,就是看看为什么perf top会导致无响应

暂无图片 评论
暂无图片 有用 0
lscomeon

message 里面确实没有什么,可以再看看crs日志,如果有系统监控的话,看看当时的系统状态,主机很有可能是被crs给重启的,可以看看另外一个节点的crs日志,在重启前的时间,发生了什么

暂无图片 评论
暂无图片 有用 0
LEE

已转主机工程师排查,需要通过主机管理口排查日志

暂无图片 评论
暂无图片 有用 0
LEE
问题已关闭: 问题已经得到解决
暂无图片 评论
暂无图片 有用 0
回答交流
提交
问题信息
请登录之后查看
附件列表
请登录之后查看
邀请回答
暂无人订阅该标签,敬请期待~~
暂无图片墨值悬赏