2022-08-02
DevOps
00

原因是我更新其中一个节点的时候另一个节点离线了。所以 corosync 配置文件中两个节点的 version 号不一致导致的。

解决方法: 复制好的节点的 /etc/corosync/corosync.conf 文件到问题节点,然后 systemctl restart corosync 就好了。

2022-08-02
DevOps
00

由于我的一系列僵硬操作,比如在一个节点下线的时候删除另一个节点,导致节点没删干净,web 界面上还是有。这时候可以删除 /etc/pve/nodes/ 下对应节点的文件夹,这样就好了。

2022-08-02
DevOps
00

有时候会漂移,在 /etc/pve/qemu-server/xxx.conf 中加入:

yml
tablet: true

然后重新启动即可。

2022-08-02
DevOps
00

今天想给 k8s deployment 中的镜像升级一下版本。发现容器内报错 lockfile 被占用,是因为默认的替换 pod 策略会先创建新的,等新的 healthy 之后再删除老 pod ,在我的场景下是需要先删除老 pod 再创建新 pod 的。根据官方文档:

如果 .spec.strategy.type==Recreate,在创建新 Pods 之前,所有现有的 Pods 会被杀死。

说明: 这只会确保为了升级而创建新 Pod 之前其他 Pod 都已终止。如果你升级一个 Deployment, 所有旧版本的 Pod 都会立即被终止。控制器等待这些 Pod 被成功移除之后, 才会创建新版本的 Pod。如果你手动删除一个 Pod,其生命周期是由 ReplicaSet 来控制的, 后者会立即创建一个替换 Pod(即使旧的 Pod 仍然处于 Terminating 状态)。 如果你需要一种“最多 n 个”的 Pod 个数保证,你需要考虑使用 StatefulSet

解决~

2022-08-01
DevOps
00

在修改网关之后需要重启网络,不想重启,可以输入:

service networking restart

搞定。(PVE 7.2.3)