Kubernetes高级调度01-EW帮帮网

特性	InitContainer	普通容器
启动时机	应用容器启动前	所有 InitContainer 完成后启动
运行目标	完成初始化任务后退出	持续运行业务逻辑
重启策略	失败后重启（受`restartPolicy`影响）	依`restartPolicy`和健康检查决定
支持的字段	无`lifecycle`、健康检查等字段	支持`lifecycle`、健康检查等
资源处理	资源请求会影响调度，但执行时优先占用资源	按配置的资源限制运行

例如，InitContainer 不支持livenessProbe（存活探针），因为它必须在 Pod 就绪前完成任务；而普通容器依赖健康检查确保业务持续可用。

1.3 InitContainer 的实战场景与示例解析

1.3.1 示例 1：延迟启动 —— 控制应用启动时机

在分布式系统中，部分应用需要等待依赖服务初始化完成后再启动（如前端服务等待后端 API 就绪）。此时可通过 InitContainer 的sleep命令实现延迟。

YAML 配置（init01.yaml）：

yaml

apiVersion: v1
kind: Pod
metadata:
  name: initc01
  labels:
    run: initc01
spec:
  terminationGracePeriodSeconds: 0
  containers:
  - name: n1
    image: nginx:1.7.9
    imagePullPolicy: IfNotPresent
  initContainers:
  - name: initc01
    image: nginx:1.7.9
    command: ["sh", "-c", "sleep 15"]  # 延迟15秒
  dnsPolicy: ClusterFirst
  restartPolicy: Never

执行与验证：

创建 Pod：kubectl create -f init01.yaml
观察状态：连续执行kubectl get pod，前 15 秒 Pod 状态为Init:0/1（初始化中），15 秒后变为Running。

原理：InitContainer 执行sleep 15后退出，Kubernetes 才启动应用容器（Nginx），确保应用在延迟后启动。

1.3.2 示例 2：权限操作 —— 修改内核参数

容器默认运行在非特权模式，无法修改内核参数（如vm.swappiness）。但 InitContainer 可通过securityContext获取特权，完成系统级配置。

YAML 配置（init02.yaml）：

yaml

apiVersion: v1
kind: Pod
metadata:
  name: initc02
  labels:
    run: initc02
spec:
  containers:
  - name: n1
    image: nginx:1.7.9
  initContainers:
  - name: initc02
    image: alpine
    command: ["sh", "-c", "/sbin/sysctl -w vm.swappiness=0"]  # 禁用swap
    securityContext:
      privileged: true  # 开启特权模式
  restartPolicy: Never

执行与验证：

应用配置：kubectl apply -f init02.yaml
查看节点内核参数：登录 Pod 所在节点（如k8s-node01），执行cat /proc/sys/vm/swappiness，结果为0，证明修改生效。

注意：privileged: true会赋予容器主机级权限，生产环境需谨慎使用，仅在必要时为 InitContainer 配置。

1.3.3 示例 3：依赖管理 —— 等待关联服务就绪

后端应用常依赖数据库、缓存等服务，需确保依赖服务可用后再启动。可通过 InitContainer 的nslookup检测服务 DNS 是否就绪。

步骤 1：创建依赖服务检测的应用 Pod（myapp.yaml）：

yaml

apiVersion: v1
kind: Pod
metadata:
  name: nginx
spec:
  containers:
  - name: nginx
    image: nginx:1.7.9
    ports:
    - containerPort: 86
  initContainers:
  - name: init-redis
    image: busybox:1.28
    command: ['sh', '-c', 'until nslookup redis-service; do echo waiting for redis; sleep 2; done;']
  - name: init-mysql
    image: busybox:1.28
    command: ['sh', '-c', 'until nslookup mysql-server; do echo waiting for mysql; sleep 2; done;']

步骤 2：创建 Redis 服务：

yaml

# redis-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: redis
spec:
  replicas: 1
  selector:
    matchLabels:
      app: redis
  template:
    metadata:
      labels:
        app: redis
    spec:
      containers:
      - name: redis
        image: redis:5.0
---
apiVersion: v1
kind: Service
metadata:
  name: redis-service
spec:
  ports:
  - port: 6379
    targetPort: 6379
  selector:
    app: redis
  type: NodePort

步骤 3：创建 MySQL 服务：

yaml

# mysql-deployment.yaml（精简版）
apiVersion: apps/v1
kind: Deployment
metadata:
  name: mysql
spec:
  replicas: 1
  selector:
    matchLabels:
      app: mysql
  template:
    metadata:
      labels:
        app: mysql
    spec:
      containers:
      - name: mysql
        image: mysql:8.0
        env:
        - name: MYSQL_ROOT_PASSWORD
          value: 'moonfdd'
---
apiVersion: v1
kind: Service
metadata:
  name: mysql-service
spec:
  ports:
  - port: 3306
    targetPort: 3306
  selector:
    app: mysql
  type: NodePort

执行与验证：

创建应用 Pod：kubectl create -f myapp.yaml，此时 Pod 状态为Init:0/2（等待两个 InitContainer 完成）。
依次创建 Redis 和 MySQL 服务：kubectl create -f redis-deployment.yaml、kubectl create -f mysql-deployment.yaml。
观察应用 Pod 状态：当两个服务的 DNS 可解析后，InitContainer 退出，应用 Pod 状态变为Running。

原理：until nslookup命令循环检测服务 DNS，直到成功解析（服务就绪）才退出，确保应用容器启动时依赖已可用。

1.4 InitContainer 的设计优势与生产实践建议

InitContainer 的核心价值在于 “分离关注点”：将初始化逻辑与业务逻辑解耦，带来三大优势：

安全性：避免在业务镜像中安装curl、sysctl等高危工具，降低攻击面；
轻量化：业务镜像仅包含核心功能，减少体积和构建时间；
灵活性：通过独立镜像管理初始化逻辑，无需修改业务代码即可调整启动流程。

生产实践建议：

限制 InitContainer 的资源占用：设置resources.limits避免资源耗尽；
避免长时间运行：初始化任务应在分钟级内完成，防止 Pod 启动超时；
日志记录：在 InitContainer 中输出关键操作日志（如echo "修改swappiness完成"），便于问题排查；
权限最小化：仅在必要时使用privileged: true，完成后立即释放权限。

第二章：Pause 容器 ——Pod 网络的 “基石”

在 Kubernetes 中，每个 Pod 都包含一个特殊的 “Pause 容器”，它并非用于暂停运行，而是作为 Pod 网络命名空间的 “基石”。理解 Pause 容器是掌握 Kubernetes 网络模型的关键。

2.1 Pause 容器的核心作用

Pause 容器是 Pod 中第一个启动的容器，其核心功能是为 Pod 内所有容器提供共享的网络命名空间，具体作用包括：

网络命名空间共享：Pod 内所有容器（包括 InitContainer、应用容器）共享 Pause 容器的 IP 地址和端口空间，可通过localhost直接通信；
网络接口管理：Pause 容器负责初始化 Pod 的网络接口（如虚拟网卡），使 Pod 能访问外部网络；
生命周期锚点：即使 Pod 内所有应用容器停止，Pause 容器仍保持运行，确保 Pod 的网络配置不丢失，直到 Pod 被彻底删除；
稳定性保障：Pause 容器仅运行/pause命令（一个无限循环），无业务逻辑，几乎不会崩溃，为 Pod 网络提供稳定支撑。

2.2 Pause 容器的实现原理与优势

Kubernetes 通过 “基础设施容器（Infra Container）” 实现 Pod 网络共享，而 Pause 容器正是 Infra 容器的具体实现。其工作原理如下：

当创建 Pod 时，Kubernetes 首先启动 Pause 容器，初始化网络命名空间；
后续所有容器通过 “Join Namespace” 机制加入 Pause 容器的网络命名空间；
所有容器共享同一套网络配置（IP、路由、防火墙规则等）。

优势：

简化网络配置：无需为每个容器单独配置网络，降低管理复杂度；
一致性保障：Pod 内容器网络视图完全一致，避免通信混乱；
轻量高效：Pause 镜像体积仅约 700KB，几乎不占用资源。

2.3 实战验证：如何观察 Pod 中的 Pause 容器

通过以下步骤可验证 Pause 容器的存在及其作用：

查看 Pod 所在节点：

bash

kubectl get pod nginx -o wide
# 输出示例：
# NAME    READY   STATUS    IP           NODE        AGE
# nginx   1/1     Running   10.244.85.286 k8s-node01  23m

登录节点查看容器：

bash

# 在节点k8s-node01上执行
docker ps | grep nginx

输出解析：

plaintext

# 应用容器（Nginx）
8feed68c83d1 ... "nginx -g 'daemon off;'" ... k8s_nginx_nginx_default_...
# Pause容器
9ee9ad88890b ... "/pause" ... k8s_POD_nginx_default_...

可见，Pod 中存在两个容器：应用容器（Nginx）和 Pause 容器（名称以k8s_POD开头）。

验证网络共享：
在应用容器中执行ip addr，其 IP 与 Pause 容器的 IP 完全一致，证明网络命名空间共享。

第三章：临时容器（Ephemeral Containers）—— 在线调试的 “急救包”

在生产环境中，为减少攻击面，业务镜像通常不包含curl、netstat等调试工具，导致容器故障时难以排查。Kubernetes 1.16 + 引入的 “临时容器” 解决了这一痛点。

3.1 临时容器的设计初衷与核心特性

临时容器是一种临时添加到 Pod 中的容器，专为在线调试设计，其核心特性包括：

临时性：手动添加到运行中的 Pod，Pod 重启后自动消失，不影响 Pod 的原始定义；
调试导向：可使用包含完整工具集的镜像（如busybox、debian），快速获取ps、netstat等工具；
无状态影响：不包含ports、livenessProbe等字段，其状态不影响 Pod 的就绪性；
创建方式特殊：通过kubectl debug命令创建，而非直接修改pod.spec，无法通过kubectl edit添加。

3.2 临时容器与普通容器的差异

特性	临时容器	普通容器
生命周期	临时存在，Pod 重启后消失	随 Pod 定义长期存在
配置字段	无`ports`、健康检查、资源限制等字段	支持完整字段
创建方式	`kubectl debug`命令	定义在`pod.spec.containers`中
作用	在线调试	运行业务逻辑
重启策略	从不重启	依`restartPolicy`配置

3.3 实战案例：使用临时容器调试 Tomcat 应用

假设我们部署了一个 Tomcat 应用，但容器内无ps命令，无法查看进程状态，此时可通过临时容器调试。

步骤 1：创建 Tomcat Pod：

yaml

# pod-tomcat.yaml
apiVersion: v1
kind: Pod
metadata:
  name: tomcat-test
spec:
  containers:
  - name: tomcat-java
    image: kubeguide/tomcat-app:v1
    ports:
    - containerPort: 8080

执行：kubectl apply -f pod-tomcat.yaml

步骤 2：添加临时容器：
使用kubectl debug命令添加一个包含ps工具的busybox容器：

bash

kubectl debug -it tomcat-test --image=busybox:1.28 --target=tomcat-java

-it：开启交互模式；
--target=tomcat-java：指定临时容器加入目标容器的进程命名空间，可查看其进程。

步骤 3：调试操作：
在临时容器的交互终端中执行：

bash

ps -ef | grep tomcat  # 查看Tomcat进程
netstat -tlnp         # 查看端口占用（需busybox支持）

输出示例：

plaintext

1 root ... org.apache.catalina.startup.Bootstrap start  # Tomcat主进程
41 root ... grep tomcat

步骤 4：验证临时容器状态：

bash

kubectl describe pod tomcat-test

在输出的 “Ephemeral Containers” 部分可看到添加的临时容器信息，包括镜像、启动时间等。

3.4 临时容器的适用场景与局限性

适用场景：

无工具镜像调试：当业务镜像基于distroless（无 shell）构建时，临时容器是唯一调试途径；
紧急故障排查：无需重启 Pod 即可添加调试工具，避免影响服务；
进程级诊断：通过--target参数进入目标容器的进程空间，查看线程、文件句柄等细节。

局限性：

权限限制：若 Pod 启用了PodSecurityPolicy或Seccomp，可能限制临时容器的权限；
集群版本要求：需 Kubernetes 1.16+，且 API 服务器启用EphemeralContainers特性；
状态不持久：Pod 重启后临时容器消失，需重新添加。

第四章：自动扩缩容（HPA）—— 应对流量波动的 “智能调节器”

在流量波动频繁的业务场景中，手动调整 Pod 副本数既低效又容易出错。Kubernetes 的 HPA（Horizontal Pod Autoscaler）可根据指标自动扩缩容，平衡服务质量与资源成本。

4.1 HPA 的基本概念与工作原理

HPA 通过监控 Pod 的 CPU、内存使用率或自定义指标（如请求数、队列长度），自动调整副本数，其核心特性包括：

水平扩缩容：仅调整 Pod 副本数，不改变单个 Pod 的资源配置（与垂直扩缩容 VPA 区分）；
指标驱动：基于 Metrics Server 采集的实时指标决策；
边界控制：可设置最小（minReplicas）和最大（maxReplicas）副本数，避免资源浪费或过载；
适用对象：支持 Deployment、ReplicaSet、StatefulSet 等，不支持 DaemonSet（每个节点仅一个 Pod）。

工作原理：

Metrics Server 定期采集 Pod 的指标数据（如 CPU 使用率）；
HPA 控制器对比当前指标与目标值（如 CPU 使用率 80%）；
若当前指标高于目标值，增加副本数；反之则减少（在minReplicas与maxReplicas之间）；
调整频率默认每 15 秒一次，可通过--horizontal-pod-autoscaler-sync-period修改。

4.2 HPA 的核心工作流程

HPA 的完整工作流程可分为四步：

配置 HPA：通过kubectl autoscale命令或 YAML 文件定义扩缩容规则，例如：

bash
```
kubectl autoscale deployment nginx-server --cpu-percent=10 --min=1 --max=10
```
表示当平均 CPU 使用率超过 10% 时扩容，副本数在 1-10 之间调整。
指标采集：Metrics Server 从 Kubelet 获取 Pod 的 CPU、内存使用数据，并通过 API 提供给 HPA 控制器。
伸缩决策：HPA 控制器计算当前指标平均值，与目标值对比：
- 若当前 CPU 使用率 = 50%，目标值 = 10%，则需要扩容（50% / 10% = 5 倍，副本数乘以 5）；
- 若当前 CPU 使用率 = 5%，则缩容（5% / 10% = 0.5 倍，副本数乘以 0.5）。
  （注：实际计算会包含平滑因子，避免频繁波动）
执行扩缩容：HPA 控制器更新 Deployment 的replicas字段，Kubernetes 根据新值创建或删除 Pod。

4.3 实战案例：基于 CPU 利用率的 Nginx 自动扩缩容

步骤 1：部署带资源请求的 Nginx Deployment：
HPA 依赖 Pod 的resources.requests作为指标计算基准，需提前配置：

yaml

# nginx-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-server
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:1.7.9
        ports:
        - containerPort: 80
        resources:
          requests:
            cpu: 10m  # 基准CPU请求（1/100核心）

执行：kubectl create -f nginx-deployment.yaml

步骤 2：创建 Service 暴露服务：

bash

kubectl expose deployment nginx-server --port=80

步骤 3：创建 HPA：

bash

kubectl autoscale deployment nginx-server --cpu-percent=10 --min=1 --max=10

参数说明：

--cpu-percent=10：目标 CPU 使用率为 10%（基于requests.cpu）；
--min=1：最小副本数 1；
--max=10：最大副本数 10。

步骤 4：观察初始状态：

bash

kubectl get hpa
# 输出示例（未加负载时）：
# NAME           REFERENCE                 TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
# nginx-server   Deployment/nginx-server   0%/10%    1         10        2          3m

步骤 5：模拟流量压力：
在新终端执行无限循环请求，增加 CPU 负载：

bash

while true; do wget -q -O- http://<nginx-service-ip> > /dev/null; done

（<nginx-service-ip>可通过kubectl get svc nginx-server获取）

步骤 6：观察扩容过程：
1 分钟后再次查看 HPA：

bash

kubectl get hpa
# 输出示例（负载升高后）：
# NAME           REFERENCE                 TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
# nginx-server   Deployment/nginx-server   55%/10%   1         10        10         5m

此时副本数已扩容至 10（达到maxReplicas）。

步骤 7：停止压力测试并观察缩容：
按Ctrl+C终止循环请求，1-2 分钟后查看：

bash

kubectl get hpa
# 输出示例（负载降低后）：
# NAME           REFERENCE                 TARGETS   MINPODS   MAXPODS   REPLICAS   AGE
# nginx-server   Deployment/nginx-server   0%/10%    1         10        1          10m

副本数缩容至 1（达到minReplicas）。

4.4 HPA 的应用场景与资源优化价值

典型应用场景：

电商促销：应对秒杀、大促期间的流量峰值；
API 服务：根据请求 QPS 自动调整副本数；
批处理任务：根据队列长度扩容计算节点。

资源优化价值：

降本增效：流量低谷时减少副本数，避免资源闲置；
高可用保障：流量高峰时自动扩容，防止服务过载；
运维减负：无需人工干预，24 小时响应流量变化。

进阶配置建议：

结合自定义指标：使用 Prometheus Adapter 扩展 HPA，支持基于requests_per_second等业务指标扩缩容；
调整扩缩容策略：通过behavior字段配置扩容 / 缩容速度（如scaleUp.stabilizationWindowSeconds避免频繁扩容）；
监控 HPA 状态：通过 Grafana 等工具监控 HPA 决策过程，优化目标指标阈值。

总结：Kubernetes 高级调度特性的协同价值

Kubernetes 的高级调度特性并非孤立存在，而是相互协同构建稳定、高效的应用运行环境：

InitContainer确保应用启动前的依赖就绪、配置正确，是 “前置保障”；
Pause 容器为 Pod 网络提供底层支撑，是 “通信基石”；
Ephemeral Containers解决在线调试难题，是 “故障诊断工具”；
HPA动态调整资源分配，是 “弹性伸缩引擎”。

这些特性共同实现了 “启动可靠、运行稳定、调试便捷、资源可控” 的云原生应用目标。在实际生产中，需根据业务场景灵活组合使用 —— 例如，为依赖数据库的微服务配置 InitContainer 等待初始化，通过 HPA 应对流量波动，同时用临时容器快速排查偶发故障。

随着 Kubernetes 的持续发展，高级调度特性将更加智能（如结合 AI 预测流量）、更加安全（如细粒度权限控制）。掌握这些特性，是构建下一代云原生应用的必备技能。

Kubernetes高级调度01

第一章：初始化容器（InitContainer）—— 应用启动前的 “准备军”

1.1 InitContainer 的基本概念与核心特性

1.2 InitContainer 与普通容器的关键区别

1.3 InitContainer 的实战场景与示例解析

1.3.1 示例 1：延迟启动 —— 控制应用启动时机

1.3.2 示例 2：权限操作 —— 修改内核参数

1.3.3 示例 3：依赖管理 —— 等待关联服务就绪

1.4 InitContainer 的设计优势与生产实践建议

第二章：Pause 容器 ——Pod 网络的 “基石”

2.1 Pause 容器的核心作用

2.2 Pause 容器的实现原理与优势

2.3 实战验证：如何观察 Pod 中的 Pause 容器

第三章：临时容器（Ephemeral Containers）—— 在线调试的 “急救包”

3.1 临时容器的设计初衷与核心特性

3.2 临时容器与普通容器的差异

3.3 实战案例：使用临时容器调试 Tomcat 应用

3.4 临时容器的适用场景与局限性

第四章：自动扩缩容（HPA）—— 应对流量波动的 “智能调节器”

4.1 HPA 的基本概念与工作原理

4.2 HPA 的核心工作流程

4.3 实战案例：基于 CPU 利用率的 Nginx 自动扩缩容

4.4 HPA 的应用场景与资源优化价值

总结：Kubernetes 高级调度特性的协同价值

网站公告

今日签到

热门文章

最新发布