实验环境:基于Ubuntu2404搭建的k8s1.32版本集群
root@master:~# kubectl get nodes
NAME STATUS ROLES AGE VERSION
master Ready control-plane 58d v1.32.1
worker01 Ready <none> 58d v1.32.1
root@master:~# kubectl get pods -A
NAMESPACE NAME READY STATUS RESTARTS AGE
kube-dashboard kubernetes-dashboard-api-66648d89bc-fsmbc 1/1 Running 0 58d
kube-dashboard kubernetes-dashboard-auth-dd6758c7b-b2r5d 1/1 Running 0 58d
kube-dashboard kubernetes-dashboard-kong-68c6566956-fd6xn 1/1 Running 0 58d
kube-dashboard kubernetes-dashboard-metrics-scraper-55cc88cbcb-d5682 1/1 Running 0 58d
kube-dashboard kubernetes-dashboard-web-6779d576bb-t7ph2 1/1 Running 0 58d
kube-system calico-kube-controllers-77969b7d87-jsndm 1/1 Running 0 58d
kube-system calico-node-smkh7 1/1 Running 0 58d
kube-system calico-node-tjpg8 1/1 Running 0 58d
kube-system coredns-69767bd799-9wtv2 1/1 Running 0 58d
kube-system coredns-69767bd799-qtpsk 1/1 Running 0 58d
kube-system etcd-master 1/1 Running 0 58d
kube-system kube-apiserver-master 1/1 Running 0 58d
kube-system kube-controller-manager-master 1/1 Running 2 (58d ago) 58d
kube-system kube-proxy-c8frl 1/1 Running 0 58d
kube-system kube-proxy-rtwtr 1/1 Running 0 58d
kube-system kube-scheduler-master 1/1 Running 2 (58d ago) 58d
基础命令
kubectl get命令
kubectl 是 Kubernetes集群的命令行工具,通过它能对 Kubernetes 集群进行管理和操作
kubectl get 是 Kubernetes 中最基础且最常用的命令之一,用于查看集群中的各种资源对象
基本语法
kubectl get [资源类型] [资源名称] [选项]
- 常用资源类型
资源类型 | 缩写 | 描述 |
---|---|---|
pods | po | 查看 Pod |
services | svc | 查看 Service |
deployments | deploy | 查看 Deployment |
replicasets | rs | 查看 ReplicaSet |
statefulsets | sts | 查看 StatefulSet |
daemonsets | ds | 查看 DaemonSet |
jobs | - | 查看 Job |
cronjobs | cj | 查看 CronJob |
nodes | no | 查看节点 |
namespaces | ns | 查看命名空间 |
persistentvolumes | pv | 查看持久卷 |
persistentvolumeclaims | pvc | 查看持久卷声明 |
configmaps | cm | 查看 ConfigMap |
secrets | - | 查看 Secret |
ingresses | ing | 查看 Ingress |
endpoints | ep | 查看 Endpoints |
- 示例:查看命名空间
root@master:~# kubectl get ns
NAME STATUS AGE
default Active 58d
kube-dashboard Active 58d
kube-node-lease Active 58d
kube-public Active 58d
kube-system Active 58d
kubernetes-dashboard Active 58d
root@master:~# kubectl get po
No resources found in default namespace.
root@master:~#
- 常用选项参数
参数 | 缩写 | 描述 | 示例 |
---|---|---|---|
–all-namespaces | -A | 查看所有命名空间的资源 | kubectl get pods -A |
–namespace | -n | 指定命名空间 | kubectl get pods -n kube-system |
–output | -o | 输出格式 (json, yaml, wide, name等) | kubectl get pods -o wide |
–selector | -l | 根据标签选择器筛选 | kubectl get pods -l app=nginx |
–show-labels | - | 显示资源的标签 | kubectl get pods --show-labels |
–watch | -w | 监视资源变化 | kubectl get pods -w |
–field-selector | - | 根据字段选择器筛选 | kubectl get pods --field-selector=status.phase=Running |
–ignore-not-found | - | 忽略未找到的错误 | kubectl get pod not-exist --ignore-not-found |
–sort-by | - | 按指定字段排序 | kubectl get pods --sort-by=.metadata.creationTimestamp |
–no-headers | - | 不显示标题行 | kubectl get pods --no-headers |
–chunk-size | - | 批量获取的大小 | kubectl get pods --chunk-size=50 |
–server-print | - | 服务器端打印 | kubectl get pods --server-print=true |
- 示例
root@master:~# kubectl get node -o wide
NAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME
master Ready control-plane 58d v1.32.1 192.168.200.160 <none> Ubuntu 24.04 LTS 6.8.0-31-generic containerd://2.0.2
worker01 Ready <none> 58d v1.32.1 192.168.200.161 <none> Ubuntu 24.04 LTS 6.8.0-31-generic containerd://2.0.2
root@master:~# kubectl get pods -n kube-system
NAME READY STATUS RESTARTS AGE
calico-kube-controllers-77969b7d87-jsndm 1/1 Running 0 58d
calico-node-smkh7 1/1 Running 0 58d
calico-node-tjpg8 1/1 Running 0 58d
coredns-69767bd799-9wtv2 1/1 Running 0 58d
coredns-69767bd799-qtpsk 1/1 Running 0 58d
etcd-master 1/1 Running 0 58d
kube-apiserver-master 1/1 Running 0 58d
kube-controller-manager-master 1/1 Running 2 (58d ago) 58d
kube-proxy-c8frl 1/1 Running 0 58d
kube-proxy-rtwtr 1/1 Running 0 58d
kube-scheduler-master 1/1 Running 2 (58d ago) 58d
- 输出格式选项
格式 | 描述 | 示例 |
---|---|---|
wide | 显示额外信息 | kubectl get pods -o wide |
json | JSON格式输出 | kubectl get pods -o json |
yaml | YAML格式输出 | kubectl get pods -o yaml |
name | 仅显示资源名称 | kubectl get pods -o name |
custom-columns | 自定义列 | kubectl get pods -o custom-columns=NAME:.metadata.name,STATUS:.status.phase |
jsonpath | 使用JSONPath表达式 | kubectl get pods -o jsonpath=‘{.items[*].metadata.name}’ |
- 示例
root@master:~# kubectl get node -o wide
NAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME
master Ready control-plane 58d v1.32.1 192.168.200.160 <none> Ubuntu 24.04 LTS 6.8.0-31-generic containerd://2.0.2
worker01 Ready <none> 58d v1.32.1 192.168.200.161 <none> Ubuntu 24.04 LTS 6.8.0-31-generic containerd://2.0.2
root@master:~# kubectl get node -o yaml
apiVersion: v1
items:
- apiVersion: v1
kind: Node
metadata:
annotations:
kubeadm.alpha.kubernetes.io/cri-socket: unix:///var/run/containerd/containerd.sock
node.alpha.kubernetes.io/ttl: "0"
projectcalico.org/IPv4Address: 192.168.200.170/24
projectcalico.org/IPv4IPIPTunnelAddr: 172.17.219.64
volumes.kubernetes.io/controller-managed-attach-detach: "true"
creationTimestamp: "2025-02-10T07:22:41Z"
labels:
beta.kubernetes.io/arch: amd64
beta.kubernetes.io/os: linux
kubernetes.io/arch: amd64
kubernetes.io/hostname: master
kubernetes.io/os: linux
node-role.kubernetes.io/control-plane: ""
node.kubernetes.io/exclude-from-external-load-balancers: ""
name: master
----------
architecture: amd64
bootID: 80363416-61dd-4a1d-adb1-04d30be5f786
containerRuntimeVersion: containerd://2.0.2
kernelVersion: 6.8.0-31-generic
kubeProxyVersion: v1.32.1
kubeletVersion: v1.32.1
machineID: c8a9b7f5efae45c5bc6a260f67e2100d
operatingSystem: linux
osImage: Ubuntu 24.04 LTS
systemUUID: 047c4d56-3c6b-8139-5e48-ae05a3e0e337
runtimeHandlers:
- features:
recursiveReadOnlyMounts: true
userNamespaces: true
name: runc
- features:
recursiveReadOnlyMounts: true
userNamespaces: true
name: ""
kind: List
metadata:
resourceVersion: ""
kubectl create命令
kubectl create 用于从文件或标准输入创建新的 Kubernetes 资源
基本语法
kubectl create -f <filename>
kubectl create <resource-type> <resource-name> [flags]
- 常用子命令和参数
子命令/参数 | 描述 | 示例 |
---|---|---|
-f, --filename | 指定要使用的文件 | kubectl create -f pod.yaml |
–dry-run | 试运行,不实际创建 | kubectl create -f pod.yaml --dry-run=client |
–edit | 在创建前编辑对象 | kubectl create -f pod.yaml --edit |
–save-config | 将当前配置保存到注解 | kubectl create -f pod.yaml --save-config |
–validate | 验证配置 | kubectl create -f pod.yaml --validate=true |
–from | 从现有资源创建 | kubectl create secret generic my-secret --from-file=./password.txt |
- 示例
创建一个nginx deployment副本,使用试运行命令最后生成一个yaml文件
root@master:~# kubectl create deployment nginx --image=nginx --replicas=3 --dry-run=client -o yaml > nginx.yaml
root@master:~# cat nginx.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
creationTimestamp: null
labels:
app: nginx
name: nginx
spec:
replicas: 3
selector:
matchLabels:
app: nginx
strategy: {}
template:
metadata:
creationTimestamp: null
labels:
app: nginx
spec:
containers:
- image: nginx
name: nginx
resources: {}
status: {}
root@master:~# kubectl create -f nginx.yaml
deployment.apps/nginx created
root@master:~# kubectl get deployments.apps
NAME READY UP-TO-DATE AVAILABLE AGE
nginx 0/3 3 0 11s
root@master:~# kubectl get pod
NAME READY STATUS RESTARTS AGE
nginx-5869d7778c-79ffh 1/1 Running 0 48m
nginx-5869d7778c-7pvfb 1/1 Running 0 48m
nginx-5869d7778c-vll79 1/1 Running 0 48m
- 常用资源创建命令
命令 | 描述 | 示例 |
---|---|---|
create deployment | 创建部署 | kubectl create deployment nginx --image=nginx |
create namespace | 创建命名空间 | kubectl create namespace dev |
create secret | 创建Secret | kubectl create secret generic my-secret --from-literal=key=value |
create configmap | 创建ConfigMap | kubectl create configmap my-config --from-file=config.properties |
create service | 创建Service | kubectl create service clusterip my-svc --tcp=80:8080 |
- 示例:创建命名空间
root@master:~# kubectl create ns test
namespace/test created
kubectl apply命令
kubectl apply 通过定义资源的配置文件来声明式地管理应用,可以创建或更新资源。
基本语法
kubectl apply -f <filename>
- 常用参数
参数 | 描述 | 示例 |
---|---|---|
-f, --filename | 指定要使用的文件 | kubectl apply -f deployment.yaml |
–dry-run | 试运行 | kubectl apply -f deploy.yaml --dry-run=client |
–prune | 删除不再需要的资源 | kubectl apply -f dir/ --prune -l app=nginx |
–overwrite | 覆盖现有配置 | kubectl apply -f config.yaml --overwrite=true |
–record | 记录当前命令 | kubectl apply -f deploy.yaml --record=true |
–force | 强制替换资源 | kubectl apply -f deploy.yaml --force |
create vs apply 对比
特性 | kubectl create | kubectl apply |
---|---|---|
类型 | 命令式 | 声明式 |
资源存在时 | 报错 | 更新资源 |
更新方式 | 需先 delete 再 create | 直接修改 YAML 后重新 apply |
幂等性 | 非幂等 | 幂等 |
适用场景 | 一次性创建 | 持续部署 |
版本控制 | 不支持 | 支持(通过注解) |
推荐使用 | 初始创建 | 日常管理 |
kubectl delete命令
kubectl delete 是用于删除 Kubernetes 集群中各种资源对象的命令,是日常运维中的关键操作之一
基本语法
kubectl delete [资源类型]/[资源名称] [选项]
kubectl delete -f [配置文件] [选项]
- 常用资源类型(支持缩写)
资源类型 | 缩写 | 示例命令格式 |
---|---|---|
pods | po | kubectl delete pod/[name] |
deployments | deploy | kubectl delete deploy/[name] |
services | svc | kubectl delete svc/[name] |
replicasets | rs | kubectl delete rs/[name] |
statefulsets | sts | kubectl delete sts/[name] |
daemonsets | ds | kubectl delete ds/[name] |
jobs | - k | ubectl delete job/[name] |
cronjobs | cj | kubectl delete cj/[name] |
configmaps | cm | kubectl delete cm/[name] |
secrets | - | kubectl delete secret/[name] |
persistentvolumes | pv | kubectl delete pv/[name] |
persistentvolumeclaims | pvc | kubectl delete pvc/[name] |
- 删除pod
root@master:~# kubectl get pod
NAME READY STATUS RESTARTS AGE
nginx-5869d7778c-f9ws4 0/1 ContainerCreating 0 4s
nginx-5869d7778c-s492b 0/1 ContainerCreating 0 4s
nginx-5869d7778c-zp65q 1/1 Running 0 4s
root@master:~# kubectl delete pod nginx-5869d7778c-f9ws4
pod "nginx-5869d7778c-f9ws4" deleted
- 核心参数详解
参数 | 缩写 | 描述 | 示例 |
---|---|---|---|
–all | - | 删除指定类型的所有资源 | kubectl delete pods --all |
–all-namespaces | -A | 跨所有命名空间删除 | kubectl delete pods -A |
–cascade | - | 级联删除策略(默认true) | kubectl delete deploy/nginx --cascade=false |
–force | - | 强制立即删除(不等待优雅终止) | kubectl delete pod/nginx --force |
–grace-period | - | 优雅删除等待时间(秒,默认30) | kubectl delete pod/nginx --grace-period=0 |
–ignore-not-found | - | 忽略不存在的资源错误 | kubectl delete pod/not-exist --ignore-not-found |
–now | - | 相当于 | –grace-period=0 kubectl delete pod/nginx --now |
–selector | -l | 根据标签选择器删除 | kubectl delete pods -l app=nginx |
–timeout | - | 删除操作的超时时间 | kubectl delete deploy/nginx --timeout=60s |
–wait | - | 等待资源完全删除(默认true) | kubectl delete svc/nginx --wait=false |
- 基本删除操作
# 删除单个Pod
kubectl delete pod/nginx
# 删除指定命名空间的Deployment
kubectl delete deploy/nginx -n default
# 通过配置文件删除
root@master:~# kubectl get pod
NAME READY STATUS RESTARTS AGE
nginx-5869d7778c-79ffh 1/1 Running 0 48m
nginx-5869d7778c-7pvfb 1/1 Running 0 48m
nginx-5869d7778c-vll79 1/1 Running 0 48m
root@master:~# kubectl delete -f nginx.yaml
deployment.apps "nginx" deleted
root@master:~# kubectl get pod
No resources found in default namespace.
root@master:~#
- 批量删除操作
# 删除所有Pod(当前命名空间)
kubectl delete pods --all
# 删除所有命名空间的指定资源
kubectl delete pods --all-namespaces
# 根据标签选择器删除
kubectl delete pods -l app=nginx
# 删除命名空间及其所有资源
kubectl delete namespace dev --cascade=true
- 特殊删除场景
# 强制立即删除Pod(跳过优雅终止)
# 默认30秒等待时间,可通过--grace-period调整
# 立即终止:--grace-period=0 --force
kubectl delete pod/nginx --grace-period=0 --force
# 只删除Pod不删除关联的Deployment
# 默认行为:删除父资源(如Deployment)时会自动删除子资源(如Pod)
# 禁用方法:--cascade=false
kubectl delete pod/nginx --cascade=false
# 删除PVC但保留PV
kubectl delete pvc/my-pvc --cascade=false
# 试运行删除(dry-run)
kubectl delete deploy/nginx --dry-run=client
kubectl describe命令
kubectl describe 是 Kubernetes 中用于查看资源详细信息的强大命令,相比 kubectl get 提供更全面的资源状态和关联信息
基本语法
kubectl describe <资源类型>/<资源名称> [选项]
kubectl describe <资源类型> [选项]
- 支持的资源类型(支持缩写)
资源类型 | 缩写 | 示例命令格式 |
---|---|---|
pods | po | kubectl describe po/nginx |
nodes | no | kubectl describe no/node1 |
deployments | deploy | kubectl describe deploy/nginx |
services | svc | kubectl describe svc/nginx |
replicasets | rs | kubectl describe rs/nginx |
statefulsets | sts | kubectl describe sts/web |
daemonsets | ds | kubectl describe ds/logging |
configmaps | cm | kubectl describe cm/config |
secrets | - | kubectl describe secret/db |
namespaces | ns | kubectl describe ns/dev |
persistentvolumes | pv | kubectl describe pv/pv1 |
persistentvolumeclaims | pvc | kubectl describe pvc/claim1 |
events | ev | kubectl describe ev |
- 查看pod详细信息
root@master:~# kubectl describe pod nginx-5869d7778c-
nginx-5869d7778c-nd9df nginx-5869d7778c-s492b nginx-5869d7778c-zp65q
root@master:~# kubectl describe pod nginx-5869d7778c-nd9df
Name: nginx-5869d7778c-nd9df
Namespace: default
Priority: 0
Service Account: default
---------
Conditions:
Type Status
PodReadyToStartContainers True
Initialized True
Ready True
ContainersReady True
PodScheduled True
Volumes:
kube-api-access-xgq2f:
Type: Projected (a volume that contains injected data from multiple sources)
TokenExpirationSeconds: 3607
ConfigMapName: kube-root-ca.crt
ConfigMapOptional: <nil>
DownwardAPI: true
QoS Class: BestEffort
Node-Selectors: <none>
Tolerations: node.kubernetes.io/not-ready:NoExecute op=Exists for 300s
node.kubernetes.io/unreachable:NoExecute op=Exists for 300s
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal Scheduled 63s default-scheduler Successfully assigned default/nginx-5869d7778c-nd9df to worker01
Normal Pulling 62s kubelet Pulling image "nginx"
Normal Pulled 9s kubelet Successfully pulled image "nginx" in 22.856s (53.215s including waiting). Image size: 72207578 bytes.
Normal Created 9s kubelet Created container: nginx
Normal Started 9s kubelet Started container nginx
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
-A, --all-namespaces | 所有命名空间 | kubectl describe pods -A |
-f, --filename | 通过文件指定资源 | kubectl describe -f pod.yaml |
-k, --kustomize | 从kustomization目录 | kubectl describe -k dir/ |
-l, --selector | 标签选择器 | kubectl describe pods -l app=nginx |
-n, --namespace | 指定命名空间 | kubectl describe po nginx -n dev |
–recursive | 处理目录递归 | kubectl describe -f manifests/ --recursive |
–show-events | 显示事件(默认true) | kubectl describe po nginx --show-events=false |
- 基础查询
# 查看Pod详细信息
kubectl describe pod/nginx
# 查看节点资源情况
kubectl describe node/node1
- 故障排查
# 查看Pod为什么无法启动
kubectl describe pod/crash-loop-pod
# 查看Service端点信息
kubectl describe svc/nginx
- 批量查询
# 查看命名空间下所有Pod
kubectl describe pods -n dev
# 按标签选择查看
kubectl describe pods -l app=nginx
kubectl explain命令
kubectl explain 是 Kubernetes 中用于查看资源定义和字段说明的内置文档工具,能够帮助用户理解各种资源的 YAML/JSON 配置结构
基本语法
kubectl explain <资源类型>[.<字段路径>] [选项]
- 查看资源类型文档
root@master:~# kubectl explain pod
KIND: Pod
VERSION: v1
DESCRIPTION:
Pod is a collection of containers that can run on a host. This resource is
created by clients and scheduled onto hosts.
FIELDS:
apiVersion <string>
APIVersion defines the versioned schema of this representation of an object.
Servers should convert recognized schemas to the latest internal value, and
may reject unrecognized values. More info:
https://git.k8s.io/community/contributors/devel/sig-architecture/api-conventions.md#resources
kind <string>
Kind is a string value representing the REST resource this object
represents. Servers may infer this from the endpoint the client submits
requests to. Cannot be updated. In CamelCase. More info:
https://git.k8s.io/community/contributors/devel/sig-architecture/api-conventions.md#types-kinds
metadata <ObjectMeta>
Standard object's metadata. More info:
https://git.k8s.io/community/contributors/devel/sig-architecture/api-conventions.md#metadata
spec <PodSpec>
Specification of the desired behavior of the pod. More info:
https://git.k8s.io/community/contributors/devel/sig-architecture/api-conventions.md#spec-and-status
status <PodStatus>
Most recently observed status of the pod. This data may not be up to date.
Populated by the system. Read-only. More info:
https://git.k8s.io/community/contributors/devel/sig-architecture/api-conventions.md#spec-and-status
- 查看嵌套字段定义
kubectl explain pod.spec.containers
- 递归显示所有字段
kubectl explain deployment --recursive
kubectl run命令
kubectl run 是 Kubernetes 中用于快速创建和运行容器的便捷命令,适合快速测试和临时部署场景
基本语法
kubectl run <名称> --image=<镜像> [其他参数]
常用参数详解
- 基本运行参数
参数 | 描述 | 示例 |
---|---|---|
–image | 指定容器镜像(必需) | –image=nginx:1.19 |
–port | 暴露容器端口 | –port=80 |
–command | 覆盖默认启动命令 | –command – /bin/sh -c ‘sleep 3600’ |
–restart | 重启策略(Always/Never/OnFailure) | –restart=Never |
- 工作负载控制参数
参数 | 描述 | 示例 |
---|---|---|
–generator | 指定资源类型(已弃用) | –generator=run-pod/v1 |
–replicas | 副本数(创建Deployment时) | –replicas=3 |
–labels | 设置资源标签 | -l app=test,env=dev |
- 环境与配置参数
参数 | 描述 | 示例 |
---|---|---|
–env | 设置环境变量 | –env=“KEY=VALUE” |
–requests | 资源请求 | –requests=‘cpu=100m,memory=256Mi’ |
–limits | 资源限制 | –limits=‘cpu=500m,memory=1Gi’ |
- 交互与调试参数
参数 | 描述 | 示例 |
---|---|---|
–rm | 退出后自动删除(交互式Pod) | –rm -it --image=busybox |
-it | 交互式终端 | -it --image=alpine |
–overrides | JSON格式覆盖配置 | –overrides=‘{…}’ |
- 基础运行示例
运行单个Nginx Pod
root@master:~# kubectl run nginx --image=nginx:latest --port=80
pod/nginx created
root@master:~# kubectl get pod
NAME READY STATUS RESTARTS AGE
nginx 1/1 Running 0 34s
# 运行临时调试容器(退出自动删除)
kubectl run debug-tool --rm -it --image=alpine -- sh
- 创建Deployment
# 创建有3个副本的Nginx Deployment
kubectl run nginx --image=nginx --replicas=3
与kubectl create的区别
特性 | kubectl run | kubectl create |
---|---|---|
设计目的 | 快速启动容器 | 显式创建资源 |
YAML生成 | 支持–dry-run -o yaml输出 | 需要明确指定文件 |
资源类型 | 主要创建Pod/Deployment | 支持所有资源类型 |
推荐场景 | 测试/临时部署 | 生产环境部署 |
kubectl cp命令
kubectl cp 是 Kubernetes 中用于在本地文件系统和容器之间复制文件和目录的命令,类似于传统的 docker cp 命令
基本语法
# 从容器复制到本地
kubectl cp <namespace>/<pod-name>:<container-path> <local-path> [-c <container-name>]
# 从本地复制到容器
kubectl cp <local-path> <namespace>/<pod-name>:<container-path> [-c <container-name>]
- 参数详解
参数 | 描述 | 示例 |
---|---|---|
/ | 指定命名空间(可选) | default/nginx-pod:/file |
-c, --container | 指定容器名称(多容器Pod必需) | -c app-container |
–no-preserve | 不保留文件属性 | –no-preserve |
–retries | 重试次数(默认0) | –retries=3 |
- 基本文件复制
# 从Pod复制文件到本地
kubectl cp my-pod:/var/log/app.log ./app.log
# 从本地复制文件到Pod
kubectl cp config.json my-pod:/etc/config.json
- 目录复制
# 复制整个目录到Pod
kubectl cp ./config/ my-pod:/etc/
# 从Pod复制目录到本地
kubectl cp my-pod:/var/log/ ./logs/
- 多容器Pod操作
# 指定容器名称
kubectl cp my-pod:/data/file.txt ./file.txt -c sidecar
- 跨命名空间操作
# 指定命名空间
kubectl cp prod/nginx-pod:/etc/nginx/nginx.conf ./nginx.conf
kubectl edit命令
kubectl edit 是 Kubernetes 中用于直接编辑集群中资源对象的命令,它提供了一种快速修改资源配置的交互式方法。
基本语法
kubectl edit <资源类型>/<资源名称> [选项]
kubectl edit <资源类型> [选项]
- 支持的资源类型(支持缩写)
资源类型 | 缩写 | 示例命令 |
---|---|---|
pods | po | kubectl edit po/nginx |
deployments | deploy | kubectl edit deploy/nginx |
services | svc | kubectl edit svc/nginx |
configmaps | cm | kubectl edit cm/app-config |
secrets | - | kubectl edit secret/db |
ingress | ing | kubectl edit ing/web |
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
-f, --filename | 通过文件指定资源 | kubectl edit -f deploy.yaml |
-k, --kustomize | 从kustomization目录 | kubectl edit -k dir/ |
-n, --namespace | 指定命名空间 | kubectl edit po nginx -n dev |
–output | 输出格式(yaml/json) | kubectl edit deploy/nginx -o json |
–record | 记录当前命令 | kubectl edit deploy/nginx --record=true |
- 示例
# 编辑Deployment
kubectl edit deploy/nginx
# 编辑指定命名空间的ConfigMap
kubectl edit cm/app-config -n dev
kubectl logs命令
kubectl logs 是 Kubernetes 中用于查看 Pod 和容器日志的核心命令,相当于容器化环境的 tail 和 cat 命令组合
基本语法
kubectl logs <pod-name> [options]
kubectl logs -f <pod-name> # 实时日志流
kubectl logs <pod-name> -c <container-name> # 多容器Pod
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
-f, --follow | 实时流式日志 | kubectl logs -f nginx |
–tail | 显示最后N行 | kubectl logs --tail=100 |
-c, --container | 指定容器名称 | kubectl logs -c sidecar |
-p, --previous | 查看前一个容器的日志(崩溃重启时) | kubectl logs -p |
–since | 显示指定时间后的日志 | kubectl logs --since=1h |
–timestamps | 显示时间戳 | kubectl logs --timestamps |
–prefix | 显示Pod/容器前缀 | kubectl logs --prefix |
-l, --selector | 按标签选择Pod | kubectl logs -l app=nginx |
- 基础日志查看
# 查看Pod最新日志
kubectl logs my-pod
# 查看指定容器日志
kubectl logs my-pod -c sidecar-container
- 实时日志监控
# 实时流式日志(类似tail -f)
kubectl logs -f my-pod
# 带时间戳的实时日志
kubectl logs -f my-pod --timestamps
# 查看特定时间段的日志
kubectl logs --since-time="2023-01-01T12:00:00Z" \
--until-time="2023-01-01T13:00:00Z" my-pod
- 历史日志分析
# 查看最近100行
kubectl logs --tail=100 my-pod
# 查看过去1小时的日志
kubectl logs --since=1h my-pod
# 查看崩溃容器的前一次日志
kubectl logs -p my-pod
- 多Pod日志聚合
# 查看Deployment所有Pod日志
kubectl logs -l app=nginx --prefix
# 实时监控多个Pod
kubectl logs -f -l app=nginx --max-log-requests=5
kubectl exec命令
kubectl exec 是 Kubernetes 中用于在容器内执行命令的核心命令,相当于容器化环境的 SSH 替代方案
基本语法
kubectl exec <pod-name> [options] -- <command> [args...]
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
-i, --stdin | 保持标准输入打开 | kubectl exec -it |
-t, --tty | 分配伪终端 | kubectl exec -it |
-c, --container | 指定容器名称 | kubectl exec -c sidecar |
–privileged | 以特权模式执行 | kubectl exec --privileged |
-q, --quie | t 只输出命令结果 | kubectl exec -q |
–shell | 指定shell路径 | –shell=/bin/bash |
- 交互式会话
# 进入Pod的交互式Shell(最常用)
root@master:~# kubectl exec -it nginx-5869d7778c-79ffh -- /bin/sh
# ls
bin dev docker-entrypoint.sh home lib64 mnt proc run srv tmp var
boot docker-entrypoint.d etc lib media opt root sbin sys usr
#
kubectl exec -it <pod-name> -- /bin/sh
# 指定容器进入
kubectl exec -it <pod-name> -c <container> -- /bin/bash
- 单次命令执行
# 执行单条命令(非交互式)
kubectl exec <pod-name> -- ls /var/log
# 获取环境变量
kubectl exec <pod-name> -- env
# 查看进程列表
kubectl exec <pod-name> -- ps aux
- 文件操作
# 查看文件内容
kubectl exec <pod-name> -- cat /etc/hosts
# 压缩日志目录
kubectl exec <pod-name> -- tar czf /tmp/logs.tar.gz /var/log
# 文件下载(需结合kubectl cp)
kubectl exec <pod-name> -- cat /path/file > local.file
kubectl port-forward命令
kubectl port-forward 是 Kubernetes 中用于建立本地与集群资源网络隧道的命令,无需暴露 Service 即可直接访问 Pod 或 Service
核心功能
- 本地直连 Pod:开发调试时访问容器内服务
- 临时测试 Service:不创建Ingress/NodePort的情况下访问服务
- 安全内网访问:通过API Server加密通道转发流量
基本语法
# Pod端口转发
kubectl port-forward <pod-name> [本地端口]:[容器端口] [选项]
# Service端口转发
kubectl port-forward svc/<service-name> [本地端口]:[服务端口] [选项]
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
–address | 绑定本地地址(默认127.0.0.1) | –address 0.0.0.0 |
–pod-running-timeout | 等待Pod运行的超时 | –pod-running-timeout=1m |
-n, --namespace | 指定命名空间 | -n dev |
–ports | 多端口转发(需v1.23+) | –ports=8080:80,8443:443 |
- 开发调试(常用)
# 转发本地8080到Pod的80端口
root@master:~# kubectl port-forward nginx-5869d7778c-79ffh 8080:80
Forwarding from 127.0.0.1:8080 -> 80
Forwarding from [::1]:8080 -> 80
Handling connection for 8080
# 浏览器访问
root@master:~# curl localhost:8080
<!DOCTYPE html>
<html>
<head>
<title>Welcome to nginx!</title>
<style>
html { color-scheme: light dark; }
body { width: 35em; margin: 0 auto;
font-family: Tahoma, Verdana, Arial, sans-serif; }
</style>
</head>
<body>
<h1>Welcome to nginx!</h1>
<p>If you see this page, the nginx web server is successfully installed and
working. Further configuration is required.</p>
<p>For online documentation and support please refer to
<a href="http://nginx.org/">nginx.org</a>.<br/>
Commercial support is available at
<a href="http://nginx.com/">nginx.com</a>.</p>
<p><em>Thank you for using nginx.</em></p>
</body>
</html>
- 数据库临时访问
# 转发MySQL
kubectl port-forward pod/mysql 3306:3306
# 客户端连接
mysql -h 127.0.0.1 -P 3306 -u root -p
- Service调试
# 转发Service端口
kubectl port-forward svc/redis 6379:6379
# Redis客户端连接
redis-cli -p 6379
- 多端口转发
# 同时转发HTTP和HTTPS
kubectl port-forward pod/nginx 8080:80 8443:443
# 或使用--ports参数(v1.23+)
kubectl port-forward pod/nginx --ports=8080:80,8443:443
kubectl patch命令
kubectl patch 是 Kubernetes 中用于对集群资源进行部分更新的命令,相比 apply 或 edit 更适合自动化场景的精准修改
基本语法
kubectl patch <资源类型>/<名称> --type=<策略> -p '<补丁内容>'
- 补丁策略对比
策略类型 | 参数值 | 特点 | 适用场景 |
---|---|---|---|
Strategic Merge Patch | strategic (默认) | 智能合并数组字段 | 修改Deployment、StatefulSet等 |
JSON Merge | Patch merge | 简单替换字段 | 简单资源配置 |
JSON Patch | json | 精确操作指令 | 需要精确控制时 |
- 基础字段修改
# 修改Deployment的副本数(Strategic Merge)
kubectl patch deploy/nginx -p '{"spec":{"replicas":3}}'
# 修改ConfigMap数据(JSON Merge)
kubectl patch cm/app-config --type merge -p '{"data":{"debug":"true"}}'
- 数组字段操作
# 添加容器环境变量(Strategic Merge)
kubectl patch deploy/nginx -p '{
"spec":{
"template":{
"spec":{
"containers":[{
"name":"nginx",
"env":[{"name":"ENV", "value":"prod"}]
}]
}
}
}
}'
- JSON Patch精准操作
# 精确替换镜像版本(JSON Patch)
kubectl patch pod/nginx --type json -p '[
{"op":"replace", "path":"/spec/containers/0/image", "value":"nginx:1.23"}
集群管理命令
有时候会遇到这样一个场景,一个节点需要升级,但是在该节点上又有许多运行的Pod,或者该节点已经瘫痪,需要保证业务功能的完善,则需要使用这组命令将该节点上运行的Pod调度到其他节点上
kubectl cordon命令
kubectl cordon 是 Kubernetes 中用于标记节点为不可调度的命令,是节点维护和集群管理的重要工具。
基本语法
kubectl cordon <节点名称> [选项]
- 核心参数
参数 | 描述 | 示例 |
---|---|---|
–dry-run | 试运行,不实际执行 | kubectl cordon node1 --dry-run=client |
–selector | 根据标签选择节点 | kubectl cordon -l node-role=worker |
- 基础用法
# 标记单个节点不可调度
kubectl cordon node1
# 验证节点状态
kubectl get nodes
# 输出中节点状态会显示"SchedulingDisabled"
- 批量操作
# 标记所有worker节点不可调度
kubectl cordon -l node-role=worker
# 标记除master外的所有节点
kubectl cordon $(kubectl get nodes -o name | grep -v master)
- 维护工作流
# 1. 首先标记节点不可调度
kubectl cordon node1
# 2. 排空节点(可选)
kubectl drain node1 --ignore-daemonsets
# 3. 维护完成后恢复
kubectl uncordon node1
和drain命令的区别
特性 | cordon | drain |
---|---|---|
调度阻止 | ✓ | ✓ |
驱逐现有Pod | ✗ | ✓ |
优雅终止 | ✗ | ✓ |
kubectl uncordon命令
kubectl uncordon 是 Kubernetes 中用于将节点重新标记为可调度的命令,是节点维护流程中的关键步骤
基本语法
kubectl uncordon <节点名称> [选项]
- 核心参数
参数 | 描述 | 示例 |
---|---|---|
–dry-run | 试运行,不实际执行 | kubectl uncordon node1 --dry-run=client |
–selector | 根据标签选择节点 | kubectl uncordon -l node-role=worker |
- 基础用法
# 恢复单个节点的调度能力
kubectl uncordon node1
# 验证节点状态
kubectl get nodes
# STATUS列不再显示"SchedulingDisabled"
- 批量操作
# 恢复所有worker节点
kubectl uncordon -l node-role=worker
# 恢复多个指定节点
kubectl uncordon node{1..3}
- 标准维护流程
# 1. 维护前标记不可调度
kubectl cordon node1
# 2. 执行维护操作...
# 3. 维护完成后恢复调度
kubectl uncordon node1
kubectl drain命令
kubectl drain 是 Kubernetes 中用于安全排空节点的命令,是节点维护和集群缩容的核心操作。
基本语法
kubectl drain <节点名称> [选项]
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
–ignore-daemonsets | 忽略DaemonSet Pod(必须指定) | –ignore-daemonsets=true |
–delete-emptydir-data | 删除EmptyDir数据 | –delete-emptydir-data=true |
–force | 强制驱逐无控制器Pod | –force |
–grace-period | 优雅终止等待时间(秒) | –grace-period=60 |
–timeout | 命令超时时间 | –timeout=5m |
–pod-selector | 按标签选择Pod | –pod-selector=app=nginx |
–disable-eviction | 使用直接删除代替驱逐(1.18+) | –disable-eviction=true |
- 标准节点维护
# 安全排空节点(保留DaemonSet)
kubectl drain node1 --ignore-daemonsets
# 执行维护操作...
# 恢复节点
kubectl uncordon node1
- 强制驱逐所有Pod
# 包括无控制器的裸Pod
kubectl drain node1 --ignore-daemonsets --force
# 立即终止(跳过优雅等待)
kubectl drain node1 --grace-period=0 --force
- 带超时控制的排空
# 限制在10分钟内完成
kubectl drain node1 --timeout=10m
- 注意事项
驱逐策略
有控制器Pod:重建到其他节点
裸Pod:需要–force才会删除
有本地存储的Pod:需–delete-emptydir-data关键限制
DaemonSet Pod:默认会阻止drain(必须用–ignore-daemonsets)
PodDisruptionBudget:会检查PDB限制
Finalizers:有finalizer的Pod可能阻塞
kubectl top命令
kubectl top 是 Kubernetes 中用于查看资源(节点和Pod)CPU/内存使用情况的命令,相当于 Kubernetes 的"任务管理器"
基本语法
# 查看节点资源使用
kubectl top nodes [节点名称] [选项]
# 查看Pod资源使用
kubectl top pods [Pod名称] [选项]
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
-A, --all-namespaces | 所有命名空间 | kubectl top pods -A |
–containers | 显示容器级数据 | kubectl top pod --containers |
-l, --selector | 按标签筛选 | kubectl top pods -l app=nginx |
–sort-by | 按指定字段排序 | kubectl top pods --sort-by=cpu |
–no-headers | 不显示标题行 | kubectl top nodes --no-headers |
–use-protocol-buffers | 使用ProtoBuf格式 | (Metrics Server v0.6+) |
- 基础监控
# 查看所有节点资源使用
kubectl top nodes
# 查看默认命名空间的Pod资源使用
kubectl top pods
# 查看kube-system命名空间的Pod
kubectl top pods -n kube-system
- 高级查询
# 按CPU使用排序
kubectl top pods --sort-by=cpu
# 按内存使用排序
kubectl top pods --sort-by=memory
# 显示容器级使用情况
kubectl top pod nginx --containers
- 结合标签筛选
# 查看所有带app=nginx标签的Pod
kubectl top pods -l app=nginx
# 查看生产环境的所有Pod
kubectl top pods -l env=production -A
如果报错:则需要安装error: Metrics Server
error: Metrics API not available
- Metrics Server 可以直接通过 YAML 清单安装,也可以通过官方Helm chart安装。要从components.yaml清单安装最新的 Metrics Server 版本,请运行以下命令。
kubectl apply -f https://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml
- 版本支持如下
kubectl taint命令
kubectl taint 是 Kubernetes 中用于管理节点污点(Taint)的关键命令,通过污点机制可以控制Pod的调度行为。
核心概念
- 污点(Taint)组成
Key:标识符(必填)
Value:值(可选)
- Effect:影响效果(必填):
- NoSchedule:禁止调度(已有Pod不受影响)
- PreferNoSchedule:尽量避免调度
- NoExecute:禁止调度并驱逐现有Pod(除非有容忍)
- 污点与容忍(Toleration)
节点设置污点
Pod通过tolerations声明容忍
基本语法
# 添加污点
kubectl taint nodes <node-name> <key>=<value>:<effect>
# 删除污点
kubectl taint nodes <node-name> <key>[:<effect>]-
# 查看污点
kubectl describe node <node-name> | grep Taints
- 参数详解
参数 | 描述 | 示例 |
---|---|---|
–overwrite | 覆盖已有污点 | –overwrite=true |
–all | 操作所有节点 | kubectl taint nodes --all |
–selector | 根据标签选择节点 | -l node-role=worker |
- 专用节点配置
# 标记GPU节点(禁止非GPU Pod调度)
kubectl taint nodes gpu-node1 gpu=true:NoSchedule
# 对应Pod需要添加toleration
# spec.tolerations:
# - key: "gpu"
# operator: "Equal"
# value: "true"
# effect: "NoSchedule"
- 节点维护
# 维护前标记并驱逐Pod
kubectl taint nodes node1 maintenance=true:NoExecute
# 维护完成后删除污点
kubectl taint nodes node1 maintenance=true:NoExecute-
- 生产环境隔离
# 标记生产专用节点
kubectl taint nodes prod-node1 env=prod:NoSchedule
# 标记测试专用节点
kubectl taint nodes test-node1 env=test:NoSchedule
- 批量操作
# 为所有worker节点添加污点
kubectl taint nodes -l node-role=worker dedicated=worker:NoSchedule
# 清除所有节点的某污点
kubectl taint nodes --all dedicated:NoSchedule-
- 复杂污点策略
# 多污点配置
kubectl taint nodes node1 key1=value1:NoSchedule key2=value2:NoExecute
# 基于存在性的污点(不检查value)
kubectl taint nodes node1 special:NoSchedule
# 对应容忍:
# - key: "special"
# operator: "Exists"
# effect: "NoSchedule"
kubectl label命令
kubectl label 是 Kubernetes 中用于管理资源标签(Labels)的核心命令,标签是 Kubernetes 中组织和选择资源的关键机制
标签特性
键值对:格式为 key=value
选择器支持:可通过 -l 参数筛选资源
元数据:不直接影响系统逻辑,用于标识和分类常见用途
环境标识(dev/stage/prod)
应用版本标记
组件分类(frontend/backend)
运维管理(owner/department)
基本语法
# 添加/更新标签
kubectl label <资源类型> <资源名称> <key>=<value>
# 删除标签
kubectl label <资源类型> <资源名称> <key>-
# 批量操作
kubectl label <资源类型> --all <key>=<value>
- 核心参数详解
参数 | 描述 | 示例 |
---|---|---|
–overwrite | 强制覆盖已有标签 | –overwrite=true |
–list | 显示现有标签 | kubectl get pods --show-labels |
-l, --selector | 按标签选择资源 | -l env=prod |
–all | 选择所有资源 | –all |
–resource-version | 指定资源版本 | –resource-version=12345 |
–dry-run | 试运行 | –dry-run=client |
- 基础标签操作
# 给节点打标签
kubectl label nodes node1 disktype=ssd
# 给Pod打标签
kubectl label pod/nginx app=web tier=frontend
# 删除标签
kubectl label pod/nginx tier-
- 批量标签管理
# 给所有Pod添加标签
kubectl label pods --all version=v1.2.3
# 按选择器批量更新
kubectl label pods -l app=nginx deployed-at=$(date +%Y%m%d)
# 命名空间下所有资源加标签
kubectl label all -n dev env=development
- 高级选择器操作
# 添加不存在的标签(使用--overwrite)
kubectl label pods -l '!owner' owner=team-a --overwrite
# 修改带特殊字符的标签
kubectl label ns/default 'cost-center=finance\ department'