暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

故障案例:删除软链接操作不当而引发故障

IT那活儿 2023-07-07
192
点击上方“IT那活儿”公众号,关注后了解更多内容,不管IT什么活儿,干就完了!!!
故障


故障背景



某天晚上对部署多节点的应用程序进行发布后,业务应用系统进行功能测试时发现,业务系统访问存在间歇性故障,有时业务系统页面访问时出现404错误。



处理过程



1. 抓取业务系统异常的界面截图

2. 分析多节点tomcat程序日志
发现某节点tomcat输出日志存在异常:
通过仔细核查多节点tomcat程序输出日志,检查发现某节点catalina.out日志文件未产生业务应用程序日志写入信息。
3. 登陆该设备检查该节点
登陆异常节点的设备,核查本次发布应用程序包应用程序目录,发现缺少本次发布的应用程序包。
$cd ../tomcat/webapps/
$ll

4. 恢复异常节点应用程序
及时恢复异常节点下的应用程序,通过从正常节点下的应用程序包复制,重新启动异常节点tomcat程序,该异常节点应用程序恢复正常。
5. 业务系统复测

经过业务系统重新测试,没有再出现业务系统访问页面出现404错误,业务系统恢复正常。本次异常故障已恢复。




问题原因



1. 删除软链时引入错误参数

删除软链时,输入的命令添加了 “/”选项,导致删除了应用程序包下所有文件。应用程序包采用软连的方式进行管理和发布。
本次发布的应用程序目录abc的软接,路径:/home/mysql/apps/abc ,源目录文件路径:/home/mysql/tomcat80/webapps/abc  ,即:
/home/mysql/apps/abc   ------> home/mysql/tomcat80/webapps/abc
1)执行命令
$cd /home/mysql/apps/
$rm -rf abc/

结果导致/home/mysql/tomcat80/webapps/abc目录下正常的应用文件被删除,引发故障。
2)故障演示
2. 正常删除软链的操作
正常删除软链操作:
$rm –rf name
如果执行rm –rf name/  将会删除name目录下的所有文件,后果很严重

改进措施:

  • 1)建立操作风险评估机制,提高风险管控。
  • 2)增加操作审核,避免错误操作。
  • 3)增加多节点环境下的程序监控,提升异常响应处理速度。

END


本文作者:程继贵(上海新炬中北团队)

本文来源:“IT那活儿”公众号

文章转载自IT那活儿,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论