pod-lifecycle
weight: 17
title: Pod 的生命周期
date: “2022-05-21T00:00:00+08:00”
type: book
本文讲解的是
Pod phase
status
字段是一个phase
字段。
phase
值。
下面是 phase
可能的值:
- 挂起(Pending
) :Pod 已被Kubernetes 系统接受,但有一个或者多个容器镜像尚未创建。等待时间包括调度Pod 的时间和通过网络下载镜像的时间,这可能需要花点时间。 - 运行中(Running
) :该Pod 已经绑定到了一个节点上,Pod 中所有的容器都已被创建。至少有一个容器正在运行,或者正处于启动或重启状态。 - 成功(Succeeded
) :Pod 中的所有容器都被成功终止,并且不会再重启。 - 失败(Failed
) :Pod 中的所有容器都已终止了,并且至少有一个容器是因为失败终止。也就是说,容器以非0 状态退出或者被系统终止。 - 未知(Unknown
) :因为某些原因无法取得Pod 的状态,通常是因为与Pod 所在主机通信失败。
下图是

Pod 状态
type
字段和一个 status
字段。type
字段是字符串,可能的值有status
字段是一个字符串,可能的值有
容器探针
探针是由 kubelet 对容器执行的定期诊断。要执行诊断,
- ExecAction:在容器内执行指定命令。如果命令退出时返回码为
0 则认为诊断成功。 - TCPSocketAction:对指定端口上的容器的
IP 地址进行TCP 检查。如果端口打开,则诊断被认为是成功的。 - HTTPGetAction:对指定的端口和路径上的容器的
IP 地址执行HTTP Get 请求。如果响应的状态码大于等于200 且小于400 ,则诊断被认为是成功的。
每次探测都将获得以下三种结果之一:
- 成功:容器通过了诊断。
- 失败:容器未通过诊断。
- 未知:诊断失败,因此不会采取任何行动。
livenessProbe
:指示容器是否正在运行。如果存活探测失败,则kubelet 会杀死容器,并且容器将受到其 重启策略 的影响。如果容器不提供存活探针,则默认状态为Success
。readinessProbe
:指示容器是否准备好服务请求。如果就绪探测失败,端点控制器将从与Pod 匹配的所有Service 的端点中删除该Pod 的IP 地址。初始延迟之前的就绪状态默认为Failure
。如果容器不提供就绪探针,则默认状态为Success
。
该什么时候使用存活(liveness)和就绪(readiness)探针?
如果容器中的进程能够在遇到问题或不健康的情况下自行崩溃,则不一定需要存活探针restartPolicy
自动执行正确的操作。
如果您希望容器在探测失败时被杀死并重新启动,那么请指定一个存活探针,并指定restartPolicy
为
如果要仅在探测成功时才开始向
如果您希望容器能够自行维护,您可以指定一个就绪探针,该探针检查与存活探针不同的端点。
请注意,如果您只想在
readinessGates
自readinessGates
应用程序可以向readinessGates
来指定
status.condition
字段的当前状态决定。如果status.conditions
字段中找不到这样的条件,则该条件的状态默认为 “False”。
下面是一个例子。
kind: Pod
---
spec:
readinessGates:
- conditionType: "www.example.com/feature-1"
status:
conditions:
- type: Ready # 内置的 Pod 状态
status: "False"
lastProbeTime: null
lastTransitionTime: 2018-01-01T00:00:00Z
- type: "www.example.com/feature-1" # 附加的额外的 Pod 状态
status: "False"
lastProbeTime: null
lastTransitionTime: 2018-01-01T00:00:00Z
containerStatuses:
- containerID: docker://abcd...
ready: true
您添加的
只有到readinessGates
条件也是
Pod 和容器状态
有关
重启策略
restartPolicy
字段,可能的值为restartPolicy
适用于restartPolicy
仅指通过同一节点上的
Pod 的生命
一般来说,phase
超过一段时间(由
有三种可用的控制器:
-
使用 Job 运行预期会终止的
Pod ,例如批量计算。Job 仅适用于重启策略为OnFailure
或Never
的Pod 。 -
对预期不会终止的
Pod 使用 ReplicationController、ReplicaSet 和 Deployment ,例如Web 服务器。ReplicationController 仅适用于具有restartPolicy
为Always 的Pod 。 -
提供特定于机器的系统服务,使用 DaemonSet 为每台机器运行一个
Pod 。
所有这三种类型的控制器都包含一个
如果节点死亡或与集群的其余部分断开连接,则phase
设置为
示例
高级liveness 探针示例
存活探针由
apiVersion: v1
kind: Pod
metadata:
labels:
test: liveness
name: liveness-http
spec:
containers:
- args:
- /server
image: k8s.gcr.io/liveness
livenessProbe:
httpGet:
# when "host" is not defined, "PodIP" will be used
# host: my-host
# when "scheme" is not defined, "HTTP" scheme will be used. Only "HTTP" and "HTTPS" are allowed
# scheme: HTTPS
path: /healthz
port: 8080
httpHeaders:
- name: X-Custom-Header
value: Awesome
initialDelaySeconds: 15
timeoutSeconds: 1
name: liveness
状态示例
-
Pod 中只有一个容器并且正在运行。容器成功退出。- 记录完成事件。
- 如果
restartPolicy
为:- Always:重启容器;
Pod phase
仍为 Running 。 - OnFailure:
Pod phase
变成 Succeeded 。 - Never:
Pod phase
变成 Succeeded 。
- Always:重启容器;
-
Pod 中只有一个容器并且正在运行。容器退出失败。- 记录失败事件。
- 如果
restartPolicy
为:- Always:重启容器;
Pod phase
仍为 Running 。 - OnFailure:重启容器;
Pod phase
仍为 Running 。 - Never:
Pod phase
变成 Failed 。
- Always:重启容器;
-
Pod 中有两个容器并且正在运行。容器1 退出失败。-
记录失败事件。
-
如果
restartPolicy 为:- Always:重启容器;
Pod phase
仍为 Running 。 - OnFailure:重启容器;
Pod phase
仍为 Running 。 - Never:不重启容器;
Pod phase
仍为 Running 。
- Always:重启容器;
-
如果有容器
1 没有处于运行状态,并且容器2 退出:- 记录失败事件。
- 如果
restartPolicy
为:- Always:重启容器;
Pod phase
仍为 Running 。 - OnFailure:重启容器;
Pod phase
仍为 Running 。 - Never:
Pod phase
变成 Failed 。
- Always:重启容器;
-
-
Pod 中只有一个容器并处于运行状态。容器运行时内存超出限制:- 容器以失败状态终止。
- 记录
OOM 事件。 - 如果
restartPolicy
为:- Always:重启容器;
Pod phase
仍为 Running 。 - OnFailure:重启容器;
Pod phase
仍为 Running 。 Never: 记录失败事件;Pod phase
仍为 Failed 。
- Always:重启容器;
-
Pod 正在运行,磁盘故障:- 杀掉所有容器。
- 记录适当事件。
Pod phase
变成 Failed 。- 如果使用控制器来运行,
Pod 将在别处重建。
-
Pod 正在运行,其节点被分段。- 节点控制器等待直到超时。
- 节点控制器将
Pod phase
设置为 Failed 。 - 如果是用控制器来运行,
Pod 将在别处重建。