
Kubernetes 事件信息是集群管理中的重要组成部分,它们提供了k8s集群中各种操作和状态变化的详细记录。这些事件可以帮助我们监控集群的运行状况,及时发现和解决问题。我们可以利用 Kubernetes之Events事件告警利器kube-eventer 通报我们需要的事件信息。

Kubernetes 事件的主要类型如下:
1. Normal Events 这些事件表示正常的操作流程,一般而言不需要特别关注,不过也能查看中间状态信息。
Scheduled:Pod 已成功调度到某个节点。
Pulling:正在拉取容器镜像。
Pulled:容器镜像已成功拉取。
Created:容器已创建。
Started:容器已启动。
Killing:容器正在被终止。
2. Warning Events 这些事件表示可能存在问题或异常情况,这是需要我们关注和处理的信息。
Failed:比如对象清单文件存在错误,或者从仓库拉取容器镜像时出现问题。常见原因包括镜像名称或标签拼写错误、私有仓库的凭据错误、镜像拉取速率限制等。
Evicted:由于节点资源不足,Pod 被驱逐了。我们可以通过设置节点的污点(taint)来防止新的 Pod 被调度到资源利用率高的节点上。
FailedScheduling:由于没有可用的节点,Pod 调度失败。可能的原因包括节点上的污点、资源不足、节点不匹配 Pod 或 Deployment 的选择器等。
FailedMount FailedAttachVolume:由于持久卷和卷声明之间的网络或配置错误,导致卷挂载或附加失败。
NodeNotReady:节点尚未准备好,无法调度 Pod。可能的原因包括节点正在准备中、节点故障等。
3. Other Common Events
CrashLoopBackOff:Pod 启动后崩溃,然后重启,再次崩溃,形成循环。
ImagePullBackOff:节点无法获取镜像。
BackOff:Pod 由于某种原因被推迟重启。
4. Node Events 这些事件与节点的状态变化有关。
NodeNotReady:节点尚未准备好,无法调度 Pod。
NodeReady:节点已准备好,可以接受工作负载。
NodeLost:节点已丢失,可能由于硬件故障等原因。
5. Volume Events 这些事件与持久卷的使用有关。
FailedMount:卷挂载失败。
FailedAttachVolume:卷附加失败。
6. Scheduling Events 这些事件与 Pod 的调度有关。
FailedScheduling:调度失败。
7. Security and Access Control Events 这些事件与集群的安全和访问控制有关。
Failed:认证失败、未授权访问尝试或 RBAC 策略更改。
8. Pod Lifecycle Events 这些事件与 Pod 的生命周期有关。
Scheduled:Pod 已被调度到节点。
Pulling:正在拉取容器镜像。
Pulled:容器镜像已成功拉取。
Created:容器已创建。
Started:容器已启动。
Killing:容器正在被终止。
9. Deployment Events 这些事件与 Deployment 的操作有关。
ScalingReplicaSet:Deployment 控制器正在扩展或缩减 ReplicaSet。
FailedCreate:Deployment 控制器创建 ReplicaSet 失败。
10. Service Events 这些事件与 Service 的操作有关。
LoadBalancerIP:为 LoadBalancer 类型的 Service 分配了 IP。
ServiceUpdate:Service 已更新。
运维笔谈已经开通AI智能对话功能,解答有关运维日常工作中遇到的问题以及经验分享,感兴趣的大佬来和我聊聊吧!对话 “阿里云k8s” 可以获取《阿里云Kubernetes项目实战手册》pdf。




