从群集中排空节点
在教程的早期步骤中,所有节点均以 Active
可用性运行。Swarm 管理器可以将任务分配给任何 Active 个节点,因此到目前为止,所有节点均可接收任务。
有时,例如在计划内维护期间,您需要将节点的可用性设置为 Drain。
Drain 的可用性设置可防止节点从群集管理器接收新任务。此外,这还意味着管理器会停止在该节点上运行的任务,并在具有 Active 可用性的节点上启动副本任务。
重要
将节点设置为
Drain并不会从该节点中移除独立容器, 例如那些使用docker run、docker compose up或 Docker Engine API 创建的容器。节点的状态(包括Drain)仅影响该节点调度 Swarm 服务工作负载的能力。
如果您尚未操作,请打开终端并通过 SSH 连接到运行您管理节点的机器。例如,本教程使用一台名为
manager1的机器。验证所有节点是否处于活跃可用状态。
$ docker node ls ID HOSTNAME STATUS AVAILABILITY MANAGER STATUS 1bcef6utixb0l0ca7gxuivsj0 worker2 Ready Active 38ciaotwjuritcdtn9npbnkuz worker1 Ready Active e216jshn25ckzbvmwlnh5jr3g * manager1 Ready Active Leader如果您尚未运行来自 滚动更新教程的
redis服务,请立即启动它:$ docker service create --replicas 3 --name redis --update-delay 10s redis:7.4.0 c5uo6kdmzpon37mgj9mwglcfw运行
docker service ps redis以查看Swarm Manager如何将任务分配给不同的节点:$ docker service ps redis NAME IMAGE NODE DESIRED STATE CURRENT STATE redis.1.7q92v0nr1hcgts2amcjyqg3pq redis:7.4.0 manager1 Running Running 26 seconds redis.2.7h2l8h3q3wqy5f66hlv9ddmi6 redis:7.4.0 worker1 Running Running 26 seconds redis.3.9bg7cezvedmkgg6c8yzvbhwsd redis:7.4.0 worker2 Running Running 26 seconds在这种情况下,Swarm 管理器向每个节点分配了一个任务。您可能会发现任务在您环境中各节点间的分配方式有所不同。
运行
docker node update --availability drain <NODE-ID>以排空被分配了任务的节点:$ docker node update --availability drain worker1 worker1检查节点以确认其可用性:
$ docker node inspect --pretty worker1 ID: 38ciaotwjuritcdtn9npbnkuz Hostname: worker1 Status: State: Ready Availability: Drain ...snip...The drained node shows
DrainforAvailability.运行
docker service ps redis以查看swarm manager如何为redis服务更新任务分配:$ docker service ps redis NAME IMAGE NODE DESIRED STATE CURRENT STATE ERROR redis.1.7q92v0nr1hcgts2amcjyqg3pq redis:7.4.0 manager1 Running Running 4 minutes redis.2.b4hovzed7id8irg1to42egue8 redis:7.4.0 worker2 Running Running About a minute \_ redis.2.7h2l8h3q3wqy5f66hlv9ddmi6 redis:7.4.0 worker1 Shutdown Shutdown 2 minutes ago redis.3.9bg7cezvedmkgg6c8yzvbhwsd redis:7.4.0 worker2 Running Running 4 minutesSwarm 管理器通过在可用度为
Drain的节点上终止任务,并在可用度为Active的节点上创建新任务来维持期望状态。运行
docker node update --availability active <NODE-ID>以将已排空的节点恢复到活动状态:$ docker node update --availability active worker1 worker1检查节点以查看更新后的状态:
$ docker node inspect --pretty worker1 ID: 38ciaotwjuritcdtn9npbnkuz Hostname: worker1 Status: State: Ready Availability: Active ...snip...当您将节点可用性重置为
Active时,它可以接收新任务:- 在扩展规模的服务更新期间
- 在滚动更新期间
- 当你将另一个节点的可用性设置为
Drain时 - 当任务在另一个活动节点上失败时
后续步骤
接下来,您将学习如何使用 Swarm 模式路由网格