docker checkpoint

描述管理检查点
用法docker checkpoint

实验性

此命令为实验性功能。

实验性功能旨在用于测试和反馈,因为其功能或设计可能会在版本之间更改,恕不另行通知,或者在未来的版本中可能被完全移除。

描述

检查点和恢复是一项实验性功能,允许您通过指定检查点来冻结正在运行的容器,这将把容器状态转换为磁盘上的一系列文件。随后,容器可以从其冻结点恢复。

这是通过使用一个名为 CRIU 的工具完成的,它是此功能的 外部依赖项。关于 Docker 中检查点和恢复历史的一个很好的概述可以在这个 Kubernetes 博客文章中找到。

安装 CRIU

如果您使用的是 Debian 系统,您可以添加 CRIU PPA 并使用 apt-get 从 CRIU launchpad 安装

或者,您可以 从源代码构建 CRIU

您至少需要 CRIU 2.0 版本才能在 Docker 中运行检查点和恢复。

检查点和恢复的使用场景

此功能目前主要针对单主机场景下的检查点和恢复。以下是一些示例:

  • 在不停止/启动容器的情况下重启主机
  • 加速启动缓慢应用的启动时间
  • 将进程“回滚”到之前的某个时间点
  • 运行进程的“取证调试”

在 Docker 之外,检查点和恢复的另一个主要用例是将服务器从一台机器实时迁移到另一台机器。当前的实现支持这样做,但目前这并不是优先事项(因此工作流程并未针对该任务进行优化)。

使用检查点和恢复

引入了一个新的顶级命令 docker checkpoint,它有三个子命令:

  • docker checkpoint create (创建一个新的检查点)
  • docker checkpoint ls (列出已有的检查点)
  • docker checkpoint rm (删除现有检查点)

此外,向 docker container start 命令添加了 --checkpoint 标志。

docker checkpoint create 的选项:

Usage:  docker checkpoint create [OPTIONS] CONTAINER CHECKPOINT

Create a checkpoint from a running container

  --leave-running=false    Leave the container running after checkpoint
  --checkpoint-dir         Use a custom checkpoint storage directory

若要恢复容器:

Usage:  docker start --checkpoint CHECKPOINT_ID [OTHER OPTIONS] CONTAINER

在容器上使用检查点和恢复的示例:

$ docker run --security-opt=seccomp:unconfined --name cr -d busybox /bin/sh -c 'i=0; while true; do echo $i; i=$(expr $i + 1); sleep 1; done'
abc0123

$ docker checkpoint create cr checkpoint1

# <later>
$ docker start --checkpoint checkpoint1 cr
abc0123

此进程仅将递增计数器记录到 stdout。如果你在运行/检查点/恢复操作之间运行 docker logs,你应该会看到计数器在进程运行时递增,在冻结时停止,并在恢复后从离开的位置继续。

已知限制

seccomp 仅在非常新的内核中受 CRIU 支持。

不支持外部终端(即 docker run -t ..)。 如果您尝试为具有外部终端的容器创建检查点, 将会失败:

$ docker checkpoint create cr checkpoint1
Error response from daemon: Cannot checkpoint container c1: rpc error: code = 2 desc = exit status 1: "criu failed: type NOTIFY errno 0\nlog file: /var/lib/docker/containers/eb62ebdbf237ce1a8736d2ae3c7d88601fc0a50235b0ba767b559a1f3c5a600b/checkpoints/checkpoint1/criu.work/dump.log\n"

$ cat /var/lib/docker/containers/eb62ebdbf237ce1a8736d2ae3c7d88601fc0a50235b0ba767b559a1f3c5a600b/checkpoints/checkpoint1/criu.work/dump.log
Error (mount.c:740): mnt: 126:./dev/console doesn't have a proper root mount

子命令

命令描述
docker checkpoint create从运行中的容器创建检查点
docker checkpoint ls列出容器的检查点
docker checkpoint rm删除检查点