从群集中排空节点


在教程的早期步骤中,所有节点均以 Active 可用性运行。Swarm 管理器可以将任务分配给任何 Active 个节点,因此到目前为止,所有节点均可接收任务。

有时,例如在计划内维护期间,您需要将节点的可用性设置为 DrainDrain 的可用性设置可防止节点从群集管理器接收新任务。此外,这还意味着管理器会停止在该节点上运行的任务,并在具有 Active 可用性的节点上启动副本任务。

重要

将节点设置为 Drain 并不会从该节点中移除独立容器, 例如那些使用 docker rundocker compose up 或 Docker Engine API 创建的容器。节点的状态(包括 Drain)仅影响该节点调度 Swarm 服务工作负载的能力。

  1. 如果您尚未操作,请打开终端并通过 SSH 连接到运行您管理节点的机器。例如,本教程使用一台名为 manager1的机器。

  2. 验证所有节点是否处于活跃可用状态。

    $ docker node ls
    
    ID                           HOSTNAME  STATUS  AVAILABILITY  MANAGER STATUS
    1bcef6utixb0l0ca7gxuivsj0    worker2   Ready   Active
    38ciaotwjuritcdtn9npbnkuz    worker1   Ready   Active
    e216jshn25ckzbvmwlnh5jr3g *  manager1  Ready   Active        Leader
    
  3. 如果您尚未运行来自 滚动更新教程的 redis 服务,请立即启动它:

    $ docker service create --replicas 3 --name redis --update-delay 10s redis:7.4.0
    
    c5uo6kdmzpon37mgj9mwglcfw
    
  4. 运行 docker service ps redis 以查看Swarm Manager如何将任务分配给不同的节点:

    $ docker service ps redis
    
    NAME                               IMAGE        NODE     DESIRED STATE  CURRENT STATE
    redis.1.7q92v0nr1hcgts2amcjyqg3pq  redis:7.4.0  manager1 Running        Running 26 seconds
    redis.2.7h2l8h3q3wqy5f66hlv9ddmi6  redis:7.4.0  worker1  Running        Running 26 seconds
    redis.3.9bg7cezvedmkgg6c8yzvbhwsd  redis:7.4.0  worker2  Running        Running 26 seconds
    

    在这种情况下,Swarm 管理器向每个节点分配了一个任务。您可能会发现任务在您环境中各节点间的分配方式有所不同。

  5. 运行 docker node update --availability drain <NODE-ID> 以排空被分配了任务的节点:

    $ docker node update --availability drain worker1
    
    worker1
    
  6. 检查节点以确认其可用性:

    $ docker node inspect --pretty worker1
    
    ID:			38ciaotwjuritcdtn9npbnkuz
    Hostname:		worker1
    Status:
     State:			Ready
     Availability:		Drain
    ...snip...
    

    The drained node shows Drain for Availability.

  7. 运行 docker service ps redis 以查看swarm manager如何为redis服务更新任务分配:

    $ docker service ps redis
    
    NAME                                    IMAGE        NODE      DESIRED STATE  CURRENT STATE           ERROR
    redis.1.7q92v0nr1hcgts2amcjyqg3pq       redis:7.4.0  manager1  Running        Running 4 minutes
    redis.2.b4hovzed7id8irg1to42egue8       redis:7.4.0  worker2   Running        Running About a minute
     \_ redis.2.7h2l8h3q3wqy5f66hlv9ddmi6   redis:7.4.0  worker1   Shutdown       Shutdown 2 minutes ago
    redis.3.9bg7cezvedmkgg6c8yzvbhwsd       redis:7.4.0  worker2   Running        Running 4 minutes
    

    Swarm 管理器通过在可用度为 Drain 的节点上终止任务,并在可用度为 Active 的节点上创建新任务来维持期望状态。

  8. 运行 docker node update --availability active <NODE-ID> 以将已排空的节点恢复到活动状态:

    $ docker node update --availability active worker1
    
    worker1
    
  9. 检查节点以查看更新后的状态:

    $ docker node inspect --pretty worker1
    
    ID:			38ciaotwjuritcdtn9npbnkuz
    Hostname:		worker1
    Status:
     State:			Ready
     Availability:		Active
    ...snip...
    

    当您将节点可用性重置为 Active 时,它可以接收新任务:

    • 在扩展规模的服务更新期间
    • 在滚动更新期间
    • 当你将另一个节点的可用性设置为 Drain
    • 当任务在另一个活动节点上失败时

后续步骤

接下来,您将学习如何使用 Swarm 模式路由网格