暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

网卡问题排查处理方法

心在远方AND走在路上 2021-08-09
1621

linux运维遇到问题现象:服务性能不稳定;网络断网

初步排查:发现网络网口丢包或错误包增加速度达到:1000个/min;一般集群主机会提示网卡问题的告警

判断可能产生问题的原因:网卡故障、光模块、线缆问题

定位问题思路:

1、  当网卡出现丢包时,可以通过ethtool –S| grep crc查看是否物理层校验有错误;

2、  ethtool| egrep 'Speed|Duplex' 查看链路速率和工作模式是否正常;

3、  其次通过ifconfig输出的错误统计,看哪些错误统计在增长再分析具体的原因(ethtool –S),如果出现err、crc、symbol等有大量计数,优先更换光模块;

4、查询出问题时间点前后的message日志,主要关注下图log keyword一列的关键字,比如T4/T5卡,在message里面搜索cat var/log/message.log | grep cxgb4;

除了link Down/UP外,如果无任何异常打印,表示网卡侧无异常;

5、排除掉网卡外,问题集中在本端光模块、线缆、对端光模块之间,优先更换光模块,只能交叉验证;

【处理步骤】

根据排查结果确认是否更换硬件



个人推荐的一句话:

逻辑源自预期、设计关乎情绪、文案展现态度




文章转载自心在远方AND走在路上,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论