暂无图片
暂无图片
5
暂无图片
暂无图片
暂无图片

【排障记录】手贱党的梦噩,老款服务器重启有风险

原创 Jose Chen 2024-08-16
441

前言

常听人说,机器重启能解决99%的问题,如果没解决,那就再重启一遍。笔者最近就因为重启服务器,导致系统异常且无法开机,还好最后解决了,和大家分享下过程。
事情的起因是某台IBM老款服务器上运行着一套windows server 2003,运行的蛮久了,得有个七八年吧。最近有人反映上面的业务出现了异常,反馈到笔者这边,笔者自然是要去解决的,毕竟这是咱的饭碗。
笔者当机立断的使用远程桌面连到该服务器上排查,顺利登录到操作系统后,发现并没有什么异常,装了个sqlserver数据库,内存,CPU都很健康。但是业务还异常着呢,业务实现逻辑咱也不清楚,于是脑海里想起了前辈们口口相传的重启大法,心一横就点击重启系统了。结果就是漫长的等待,发现ping正常了,但是远程桌面依旧无法连接。
抬起屁股,笔者就进了机房,连上VGA查看,发现显示器黑屏,没考虑多久,就去手动强制重启服务器了,毕竟家用电脑不都这么干的嘛。等到IBM的动画加载完,迎来的就是如下的画面,表示震惊,重启多遍依旧如此,当天的工作就此展开。。
ee4d80f130f30d5f1c036f173c75dab.jpg

解决步骤

上述提到,我试过多次重启,盼望服务器能把windows位于config文件夹下面的system文件给跳过去,好让系统能起来,但是没有。初步判断是硬盘上的文件已经损坏,根据多年的DBA经验来判断(吹牛逼),坏的可能不止这一个文件,只是这个文件先被检测出来,虽然我也不知道这个文件是干嘛用的,一念至此,心还有点小紧张,只能走一步看一步了。
一念至此,我选择了求助搜索引擎,AI等辅助手段,终于得到了两个解决问题的思路。第一,重装系统;第二,找台一摸一样的操作系统,把system文件拷贝过来替换损坏的文件就可以了。显然我选了第二种,毕竟这是业务服务器呢。

part1 制作U盘(PE系统)

手里边正好有个空闲的U盘,直接网络搜索某白菜U盘制作,把U盘装上PE系统,插到另一台安装同样操作系统的服务器的USB口。

part2 U盘启动PE系统

确认不影响业务的情况下,重启IBM服务器,狂摁F12,进入boot device界面,此时能看到U盘的选项,使用键盘下拉选择U盘启动,回车进入某白菜页面,选择第二项。
1723770030139.png

part3 拷贝正常无损的system文件和config文件夹

加载完顺利进入到系统后,直接进入C盘相应的目录。出于DBA的直觉,考虑到不止一个文件损坏,所以我直接把整个config文件夹给拷贝了过来,避免来回折腾。
注:不直接进操作系统拷贝的原因是,操作系统会锁定system文件,不允许拷贝,所以只能进入PE系统拷贝。

part4 U盘重新插回故障服务器,进行文件覆盖

与上述一样的流程引导进入故障服务器的PE系统中,将system文件拷贝到相应目录进行覆盖,重启系统。发现服务器能够进入操作系统,但是会报错,并且无限重启,如图所示。
1723770451271.png

part5 覆盖整个config文件夹

光覆盖一个system文件,无法解决问题,笔者索引直接将整个config文件夹对故障服务器进行了覆盖,此时服务器无限重启的问题是解决了,但是密码无论怎么试,都是输入错误。另外系统提示IP地址冲突。此时笔者意识到,config文件可能存储着上一台电脑的系统密码和IP信息。

part6 修改系统密码

由于PE系统有修改系统管理员密码的功能,笔者就再次进入,修改了下admin的密码。重启后,系统终于可以登录了。查看IP地址,果不其然,地址被替换成了另一台服务器的地址,火速改回。此时观察操作系统已经恢复正常,故障解决。

后话

小小的动作,大大的后果。可能笔者描述的步骤不算太多,但是一台老旧服务器的重启速度堪比蜗牛,一天的时间都耗在了等待上了。所以奉劝各位,面对老旧的服务器,做重启尤其是强制重启动作的时候,要慎之又慎。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论