分享一些在部署k8s集群时遇到的问题

发布于:2024-11-02 ⋅ 阅读:(10) ⋅ 点赞:(0)

目录

一、k8s拉取镜像失败,多半是docker镜像源失效了,需要经常更新

1.编辑该配置文件:

2.重启服务器:

二、kubectl get nodes时出现:The connection to the server localhost:8080 was refused - did you specify the right host or port?

1.创建该目录:

三、初始化后,kubectl get nodes: Unable to connect to the server: x509: certificate signed by unknown authority

1.清除集群的一些文件:

2.再一次执行初始化

四、master一直处于noteady

解决:1.查看日志:

2.编辑删除这个配置:

3.重启kubectl 3.1在master节点上,直接执行命令:

3.2在slave节点上,先设置节点为不可调度状态,然后驱逐节点上的pods。如果重启失败,可以查看系统日志中关于kubelet的部分,使用命令:

五、去除master节点的污点,部署服务到master

1.要去掉master节点的污点,可以使用以下方法:

1.1查看节点污点信息:

2.使用命令去掉master节点的污点:

3.再次查看污点信息:


一、k8s拉取镜像失败,多半是docker镜像源失效了,需要经常更新

解决:

1.编辑该配置文件:
vi /etc/resolv.conf

把这里的DNS的替换为阿里云的DNS地址(223.5.5.5)

2.重启服务器:
reboot

二、kubectl get nodes时出现:The connection to the server localhost:8080 was refused - did you specify the right host or port?

解决:

1.创建该目录:
mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

三、初始化后,kubectl get nodes: Unable to connect to the server: x509: certificate signed by unknown authority

解决:

1.清除集群的一些文件:
kubeadm reset
rm -rf $HOME/.kube
2.再一次执行初始化

四、master一直处于noteady

解决:
1.查看日志:
journalctl -fu kubelet

发现是报错信息提cni未安装

2.编辑删除这个配置:
vim /var/lib/kubelet/kubeadm-flags.env
3.重启kubectl 
3.1在master节点上,直接执行命令:
sudo systemctl restart kubelet
3.2在slave节点上,先设置节点为不可调度状态,然后驱逐节点上的pods。如果重启失败,可以查看系统日志中关于kubelet的部分,使用命令:
journalctl -fu kubelet

五、去除master节点的污点,部署服务到master

解决:

1.要去掉master节点的污点,可以使用以下方法:
1.1查看节点污点信息:
kubectl describe node NODE_NAME | grep Taints
2.使用命令去掉master节点的污点:
kubectl taint nodes node-role.kubernetes.io/master- 
3.再次查看污点信息:
kubectl describe node NODE_NAME | grep Taints