pod-lifecycle


weight: 17 title: Pod的生命周期 date: “2022-05-21T00:00:00+08:00” type: book

本文讲解的是KubernetesPod的生命周期,包括生命周期的不同阶段、存活和就绪探针、重启策略等。

Pod phase

Podstatus 字段是一个PodStatus对象,PodStatus中有一个 phase 字段。

Pod的相位(phase)是Pod在其生命周期中的简单宏观概述。该字段并不是对容器或Pod的综合汇总,也不是为了做为综合状态机。

Pod相位的数量和含义是严格指定的。除了本文档中列举的状态外,不应该再假定Pod有其他的 phase 值。

下面是 phase 可能的值:

  • 挂起(PendingPod已被Kubernetes系统接受,但有一个或者多个容器镜像尚未创建。等待时间包括调度Pod的时间和通过网络下载镜像的时间,这可能需要花点时间。
  • 运行中(Running:该Pod已经绑定到了一个节点上,Pod中所有的容器都已被创建。至少有一个容器正在运行,或者正处于启动或重启状态。
  • 成功(SucceededPod中的所有容器都被成功终止,并且不会再重启。
  • 失败(FailedPod中的所有容器都已终止了,并且至少有一个容器是因为失败终止。也就是说,容器以非0状态退出或者被系统终止。
  • 未知(Unknown:因为某些原因无法取得Pod的状态,通常是因为与Pod所在主机通信失败。

下图是Pod的生命周期示意图,从图中可以看到Pod状态的变化。

Pod 的生命周期示意图(图片来自网络)
Pod的生命周期示意图(图片来自网络)

Pod状态

Pod有一个PodStatus对象,其中包含一个PodCondition数组。PodCondition数组的每个元素都有一个 type 字段和一个 status 字段。type 字段是字符串,可能的值有PodScheduled、Ready、Initialized、UnschedulableContainersReadystatus 字段是一个字符串,可能的值有TrueFalseUnknown

容器探针

探针是由 kubelet 对容器执行的定期诊断。要执行诊断,kubelet调用由容器实现的 Handler。有三种类型的处理程序:

  • ExecAction:在容器内执行指定命令。如果命令退出时返回码为0则认为诊断成功。
  • TCPSocketAction:对指定端口上的容器的IP地址进行TCP检查。如果端口打开,则诊断被认为是成功的。
  • HTTPGetAction:对指定的端口和路径上的容器的IP地址执行HTTP Get请求。如果响应的状态码大于等于200且小于400,则诊断被认为是成功的。

每次探测都将获得以下三种结果之一:

  • 成功:容器通过了诊断。
  • 失败:容器未通过诊断。
  • 未知:诊断失败,因此不会采取任何行动。

Kubelet可以选择是否执行在容器上运行的两种探针执行和做出反应:

  • livenessProbe:指示容器是否正在运行。如果存活探测失败,则kubelet会杀死容器,并且容器将受到其 重启策略 的影响。如果容器不提供存活探针,则默认状态为 Success
  • readinessProbe:指示容器是否准备好服务请求。如果就绪探测失败,端点控制器将从与Pod匹配的所有Service的端点中删除该PodIP地址。初始延迟之前的就绪状态默认为 Failure。如果容器不提供就绪探针,则默认状态为 Success

该什么时候使用存活(liveness)和就绪(readiness)探针?

如果容器中的进程能够在遇到问题或不健康的情况下自行崩溃,则不一定需要存活探针; kubelet将根据PodrestartPolicy 自动执行正确的操作。

如果您希望容器在探测失败时被杀死并重新启动,那么请指定一个存活探针,并指定restartPolicyAlwaysOnFailure

如果要仅在探测成功时才开始向Pod发送流量,请指定就绪探针。在这种情况下,就绪探针可能与存活探针相同,但是spec中的就绪探针的存在意味着Pod将在没有接收到任何流量的情况下启动,并且只有在探针探测成功后才开始接收流量。

如果您希望容器能够自行维护,您可以指定一个就绪探针,该探针检查与存活探针不同的端点。

请注意,如果您只想在Pod被删除时能够排除请求,则不一定需要使用就绪探针;在删除Pod时,Pod会自动将自身置于未完成状态,无论就绪探针是否存在。当等待Pod中的容器停止时,Pod仍处于未完成状态。

readinessGates

Kubernetes 1.14(该版本readinessGatesGA,在1.11版本是为alpha)起默认支持Pod就绪检测机制扩展。

应用程序可以向PodStatus注入额外的反馈或信号:Pod readiness。要使用这个功能,请在PodSpec中设置 readinessGates 来指定kubelet评估Pod readiness的附加条件列表。

Readiness gatesPodstatus.condition 字段的当前状态决定。如果KubernetesPodstatus.conditions 字段中找不到这样的条件,则该条件的状态默认为 “False”。

下面是一个例子。

kind: Pod
---
spec:
  readinessGates:
    - conditionType: "www.example.com/feature-1"
status:
  conditions:
    - type: Ready # 内置的 Pod 状态
      status: "False"
      lastProbeTime: null
      lastTransitionTime: 2018-01-01T00:00:00Z
    - type: "www.example.com/feature-1" # 附加的额外的 Pod 状态
      status: "False"
      lastProbeTime: null
      lastTransitionTime: 2018-01-01T00:00:00Z
  containerStatuses:
    - containerID: docker://abcd...
      ready: true

您添加的Pod条件的名称必须符合Kuberneteslabel key格式

只有到Pod中的所有容器状态都是Ready,且Pod附加的额外状态检测的 readinessGates 条件也是Ready的时候,Pod的状态才是Ready

Pod和容器状态

有关Pod容器状态的详细信息,请参阅PodStatusContainerStatus。请注意,报告的Pod状态信息取决于当前的ContainerState

重启策略

PodSpec中有一个 restartPolicy 字段,可能的值为AlwaysOnFailureNever。默认为AlwaysrestartPolicy 适用于Pod中的所有容器。restartPolicy 仅指通过同一节点上的kubelet重新启动容器。失败的容器由kubelet以五分钟为上限的指数退避延迟(10秒,20秒,40秒…)重新启动,并在成功执行十分钟后重置。如 Pod文档 中所述,一旦绑定到一个节点,Pod将永远不会重新绑定到另一个节点。

Pod的生命

一般来说,Pod不会消失,直到人为销毁他们。这可能是一个人或控制器。这个规则的唯一例外是成功或失败的 phase 超过一段时间(由master确定)的Pod将过期并被自动销毁。

有三种可用的控制器:

  • 使用 Job 运行预期会终止的Pod,例如批量计算。Job仅适用于重启策略为 OnFailureNeverPod

  • 对预期不会终止的Pod使用 ReplicationControllerReplicaSetDeployment ,例如Web服务器。ReplicationController仅适用于具有 restartPolicyAlwaysPod

  • 提供特定于机器的系统服务,使用 DaemonSet 为每台机器运行一个Pod

所有这三种类型的控制器都包含一个PodTemplate。建议创建适当的控制器,让它们来创建Pod,而不是直接自己创建Pod。这是因为单独的Pod在机器故障的情况下没有办法自动复原,而控制器却可以。

如果节点死亡或与集群的其余部分断开连接,则Kubernetes将应用一个策略将丢失节点上的所有Podphase 设置为Failed

示例

高级liveness探针示例

存活探针由kubelet来执行,因此所有的请求都在kubelet的网络命名空间中进行。

apiVersion: v1
kind: Pod
metadata:
  labels:
    test: liveness
  name: liveness-http
spec:
  containers:
    - args:
        - /server
      image: k8s.gcr.io/liveness
      livenessProbe:
        httpGet:
          # when "host" is not defined, "PodIP" will be used
          # host: my-host
          # when "scheme" is not defined, "HTTP" scheme will be used. Only "HTTP" and "HTTPS" are allowed
          # scheme: HTTPS
          path: /healthz
          port: 8080
          httpHeaders:
            - name: X-Custom-Header
              value: Awesome
        initialDelaySeconds: 15
        timeoutSeconds: 1
      name: liveness

状态示例

  • Pod中只有一个容器并且正在运行。容器成功退出。

    • 记录完成事件。
    • 如果 restartPolicy 为:
      • Always:重启容器;Podphase仍为Running
      • OnFailure:Podphase变成Succeeded
      • Never:Podphase变成Succeeded
  • Pod中只有一个容器并且正在运行。容器退出失败。

    • 记录失败事件。
    • 如果 restartPolicy 为:
      • Always:重启容器;Podphase仍为Running
      • OnFailure:重启容器;Podphase仍为Running
      • Never:Podphase变成Failed
  • Pod中有两个容器并且正在运行。容器1退出失败。

    • 记录失败事件。

    • 如果restartPolicy为:

      • Always:重启容器;Podphase仍为Running
      • OnFailure:重启容器;Podphase仍为Running
      • Never:不重启容器;Podphase仍为Running
    • 如果有容器1没有处于运行状态,并且容器2退出:

      • 记录失败事件。
      • 如果 restartPolicy 为:
        • Always:重启容器;Podphase仍为Running
        • OnFailure:重启容器;Podphase仍为Running
        • Never:Podphase变成Failed
  • Pod中只有一个容器并处于运行状态。容器运行时内存超出限制:

    • 容器以失败状态终止。
    • 记录OOM事件。
    • 如果 restartPolicy 为:
      • Always:重启容器;Podphase仍为Running
      • OnFailure:重启容器;Podphase仍为Running
      • Never:记录失败事件;Podphase仍为Failed
  • Pod正在运行,磁盘故障:

    • 杀掉所有容器。
    • 记录适当事件。
    • Podphase变成Failed
    • 如果使用控制器来运行,Pod将在别处重建。
  • Pod正在运行,其节点被分段。

    • 节点控制器等待直到超时。
    • 节点控制器将Podphase设置为Failed
    • 如果是用控制器来运行,Pod将在别处重建。

参考

上一页
下一页