Etcd 单个节点宕机后无法自动恢复本文主要介绍 Etcd 单个节点宕机后无法自动恢复的解决方案。该方案操作期间集群正常提供服务,不影响用户业务。适用范围Etcd 版本为 etcd 3.4.16 - 2.0.1 及以上版本。问题现象3 节点或 5 节点的 Etcd 集群,其中一个节点所在物理机发生宕机,节点迁移后,该节点上的 Etcd 程序未能启动,导致单节点监控异常(此时 Etcd 集群服务正常)。解决方案移除异常的 etcd 节点,再重新添加节点,即可将节点到恢复活跃状态。步骤一:停止进程说明AppCenter 中健康检查机制会定时触发,如果检测到不健康,会调用相应的 cmd 脚本,APP 内部可以在 cmd 脚本里面启动这个服务。为了避免 Appcenter 一直不停地启动这个服务,需要执行以下步骤停止异常节点上的进程,否则可能导致无法正常恢复 Etcd 节点。登录异常的 etcd 节点。例如 192.168.0.101 异常。执行以下命令,复制 etcd.service 文件并命名为 etcd1.service。mv /etc/systemd/system/etcd.servi
番茄炖西红柿
番茄炖西红柿 版权所有 © 2018 - 2023