
linux运维遇到问题现象:服务性能不稳定;网络断网
初步排查:发现网络网口丢包或错误包增加速度达到:1000个/min;一般集群主机会提示网卡问题的告警
判断可能产生问题的原因:网卡故障、光模块、线缆问题
定位问题思路:
1、 当网卡出现丢包时,可以通过ethtool –S

2、 ethtool

3、 其次通过ifconfig

4、查询出问题时间点前后的message日志,主要关注下图log keyword一列的关键字,比如T4/T5卡,在message里面搜索cat var/log/message.log | grep cxgb4;


除了link Down/UP外,如果无任何异常打印,表示网卡侧无异常;
5、排除掉网卡外,问题集中在本端光模块、线缆、对端光模块之间,优先更换光模块,只能交叉验证;
【处理步骤】
根据排查结果确认是否更换硬件
个人推荐的一句话:
逻辑源自预期、设计关乎情绪、文案展现态度
文章转载自心在远方AND走在路上,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




