隔离具有用户命名空间的容器
Linux 命名空间为正在运行的进程提供隔离,限制其访问 添加到系统资源中,而正在运行的进程不知道这些限制。 有关 Linux 命名空间的更多信息,请参阅 Linux 命名空间。
防止来自容器内部的权限提升攻击的最佳方法是
将容器的应用程序配置为以非特权用户身份运行。为
其进程必须作为root
user 中,您
可以将此用户重新映射到 Docker 主机上的低权限用户。映射的
user 被分配了一系列 UID,这些 UID 在命名空间中正常运行
UID 从 0 到 65536,但对主机本身没有权限。
关于重新映射和从属用户和组 ID
重新映射本身由两个文件处理:/etc/subuid
和/etc/subgid
.
每个文件的工作方式都相同,但一个文件与用户 ID 范围有关,而
other 替换为组 ID 范围。请考虑/etc/subuid
:
testuser:231072:65536
这意味着testuser
分配的从属用户 ID 范围231072
以及接下来的 65536 个整数。UID231072
映射到
namespace (在本例中为容器内) 指定为 UID0
(root
).UID231073
映射为 UID1
等。如果进程尝试提升权限
在命名空间之外,进程作为非特权高号运行
主机上的 UID,它甚至没有映射到真实用户。这意味着
在 Host 系统上完全没有权限。
注意
可以为给定用户或组分配多个从属范围 通过在
/etc/subuid
或/etc/subgid
文件。在这种情况下,Docker 只使用第一个 5 个映射,根据内核只有 5 个条目的限制 在/proc/self/uid_map
和/proc/self/gid_map
.
当您将 Docker 配置为使用userns-remap
功能,您可以选择
指定现有用户和/或组,或者您可以指定default
.如果你
指定default
、用户和组dockremap
为此而创建
目的。
警告
某些分配不会自动将新组添加到
/etc/subuid
和/etc/subgid
文件。如果是这样的话,您可能已经 手动编辑这些文件并分配非重叠范围。此步骤为 在先决条件中介绍。
范围不重叠非常重要,这样过程就无法获得 访问。在大多数 Linux 发行版中,系统实用程序 在添加或删除用户时管理范围。
这种重新映射对容器是透明的,但会引入一些 容器需要访问 Docker 主机上的资源,例如将挂载绑定到文件系统的区域 系统用户无法写入的从安全的角度来看,最好 避免这些情况。
先决条件
从属 UID 和 GID 范围必须与现有用户关联。 即使关联是实现细节。用户拥有 在
/var/lib/docker/
.如果你没有 想要使用现有用户,Docker 可以为您创建一个并使用该用户。如果 要使用现有的用户名或用户 ID,它必须已经存在。 通常,这意味着相关条目需要位于/etc/passwd
和/etc/group
,但如果您使用的是其他 authentication 后端,此要求可能会以不同的方式转换。要验证这一点,请使用
id
命令:$ id testuser uid=1001(testuser) gid=1001(testuser) groups=1001(testuser)
在主机上处理命名空间重新映射的方式是使用两个文件,即
/etc/subuid
和/etc/subgid
.这些文件通常是托管的 在添加或删除用户或组时自动,但在某些 发行版,您可能需要手动管理这些文件。每个文件都包含三个字段:用户的用户名或 ID,后跟 开始的 UID 或 GID(在命名空间中被视为 UID 或 GID 0) 以及用户可用的 UID 或 GID 的最大数量。例如 给定以下条目:
testuser:231072:65536
这意味着由
testuser
是 由主机 UID 拥有231072
(看起来像 UID0
在 namespace) 通过 296607 (231072 + 65536 - 1) 进行。这些范围不应重叠, 来确保命名空间进程无法访问彼此的命名空间。添加用户后,选中
/etc/subuid
和/etc/subgid
以查看您的 user 在每个 URL 中都有一个条目。如果没有,您需要添加它,小心 避免重叠。如果要使用
dockremap
由 Docker 自动创建的 user, 检查dockremap
条目 配置并重新启动 Docker。如果 Docker 主机上有任何位置存在非特权 用户需要写入,调整这些位置的权限 因此。如果您想使用
dockremap
用户 自动创建,但您无法修改 权限,直到配置并重新启动 Docker 之后。使
userns-remap
有效屏蔽现有镜像和容器 层以及/var/lib/docker/
.这是 因为 Docker 需要调整这些资源的所有权,实际上 将它们存储在/var/lib/docker/
.最好启用 此功能在新的 Docker 安装上,而不是现有安装上。同样,如果您禁用
userns-remap
您无法访问任何 启用时创建的资源。检查对 user 的限制 命名空间,以确保您的用例是可能的。
在守护程序上启用 userns-remap
您可以开始dockerd
使用--userns-remap
标记或遵循此
使用daemon.json
配置文件。
这daemon.json
方法。如果您使用该标志,请使用以下
命令作为模型:
$ dockerd --userns-remap="testuser:testuser"
编辑
/etc/docker/daemon.json
.假设文件以前为空, 以下条目启用userns-remap
使用名为testuser
.您可以按 ID 或名称对用户和组进行寻址。您只需要 如果组名称或 ID 与用户名或 ID 不同,请指定组名称或 ID。如果 您提供用户和组名称或 ID,用冒号分隔 (:
) 字符。以下格式都适用于该值,假设 UID 和 GIDtestuser
是1001
:testuser
testuser:testuser
1001
1001:1001
testuser:1001
1001:testuser
{ "userns-remap": "testuser" }
注意
要使用
dockremap
user 并让 Docker 为您创建它, 将值设置为default
而不是testuser
.保存文件并重新启动 Docker。
如果您使用的是
dockremap
用户,请验证 Docker 是否使用 这id
命令。$ id dockremap uid=112(dockremap) gid=116(dockremap) groups=116(dockremap)
验证该条目是否已添加到
/etc/subuid
和/etc/subgid
:$ grep dockremap /etc/subuid dockremap:231072:65536 $ grep dockremap /etc/subgid dockremap:231072:65536
如果这些条目不存在,请将文件编辑为
root
user 和 分配一个起始 UID 和分配最高的 GID 加上 offset (在本例中为65536
).请注意,不允许 范围。使用
docker image ls
命令。输出应为空。从
hello-world
镜像。$ docker run hello-world
验证 中是否存在命名空间目录
/var/lib/docker/
叫 替换为命名空间用户的 UID 和 GID,该 UID 和 GID 拥有, 而不是 group-or-world-readable。一些子目录仍然是 所有者root
并具有不同的权限。$ sudo ls -ld /var/lib/docker/231072.231072/ drwx------ 11 231072 231072 11 Jun 21 21:19 /var/lib/docker/231072.231072/ $ sudo ls -l /var/lib/docker/231072.231072/ total 14 drwx------ 5 231072 231072 5 Jun 21 21:19 aufs drwx------ 3 231072 231072 3 Jun 21 21:21 containers drwx------ 3 root root 3 Jun 21 21:19 image drwxr-x--- 3 root root 3 Jun 21 21:19 network drwx------ 4 root root 4 Jun 21 21:19 plugins drwx------ 2 root root 2 Jun 21 21:19 swarm drwx------ 2 231072 231072 2 Jun 21 21:21 tmp drwx------ 2 root root 2 Jun 21 21:19 trust drwx------ 2 231072 231072 3 Jun 21 21:19 volumes
您的目录列表可能会有一些差异,尤其是当您 使用与
aufs
.将改用重新映射的用户所拥有的目录 的
/var/lib/docker/
和 未使用的版本(例如/var/lib/docker/tmp/
在此处的示例中) 可以删除。Docker 不使用它们,而userns-remap
是 启用。
禁用容器的命名空间重新映射
如果在守护进程上启用用户命名空间,则所有容器都使用 用户命名空间。在某些情况下,例如特权 containers 时,您可能需要为特定容器禁用用户命名空间。 有关其中一些限制,请参阅用户命名空间已知限制。
要禁用特定容器的用户命名空间,请添加--userns=host
flag 添加到docker container create
,docker container run
或docker container exec
命令。
使用此标志时有一个副作用:不会为该容器启用用户重新映射,但由于只读(镜像)层在容器之间共享,因此容器文件系统的所有权仍将被重新映射。
这意味着整个容器文件系统将属于--userns-remap
守护进程配置 (231072
在上面的示例中)。这可能会导致容器内的程序出现意外行为。例如sudo
(检查其Binaries是否属于 user0
) 或带有setuid
旗。
用户命名空间已知限制
以下标准 Docker 功能与运行 Docker 不兼容 启用了用户命名空间的守护进程:
- 与主机共享 PID 或 NET 命名空间 (
--pid=host
或--network=host
). - 不知道或无法使用的外部(卷或存储)驱动程序 守护程序用户映射。
- 使用
--privileged
mode 标志打开docker run
而不指定--userns=host
.
用户命名空间是一项高级功能,需要与其他 能力。例如,如果卷是从主机挂载的,则文件所有权 如果需要对卷内容的读或写访问权,则必须预先安排。
虽然用户命名空间容器进程中的 root 用户具有许多
超级用户在容器(Linux 内核)中的预期权限
根据内部知识施加限制,即这是一个用户命名空间
过程。一个值得注意的限制是无法使用mknod
命令。
当 运行时,在容器内创建设备的权限被拒绝
这root
用户。