
Pod 健康检查失败的历史
步骤1:日志
Kubernetes 工作节点的 syslog — 没有任何信息。 Kubelet 日志 — 没有任何信息。 Containerd 日志 — 没有任何信息。 CNI 日志 — 没有任何信息。 最近失败检查的 Pod 中的日志 — 没有任何信息:它们似乎很正常。 失败的 Pod “朋友”的日志 — 没有任何信息:它们似乎没有检测到任何友好服务的停机时间。
它与云没有关系:我们在 AWS ec2 和本地虚拟机中都经历了相同的失败节奏。 与 CNI 无关:不同的云使用不同的 CNI。我们在本地使用 calico,在 AWS 中使用 AWS CNI。 与 Containerd 或 Kubernetes 版本无关:它在任何地方都失败了。 不依赖于集群负载:它发生在测试环境中,在高峰期和夜间。
步骤2:tcpdump
步骤3:ss
步骤4:conntrack
步骤5:ipvs
作者:Roman Kuchin
本文由“云原生数据库”小编翻译。
文章转载自云原生数据库,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




