优化构建中的缓存使用

使用 Docker 进行构建时，如果指令，它所依赖的文件自以前以来没有更改建立。重用缓存中的层可以加快构建过程，因为 Docker 不必再次重新构建图层。

以下是一些可用于优化构建缓存和加速的技术构建过程：

对层进行排序：将命令放入 Dockerfile 的逻辑顺序可以帮助你避免不必要的缓存失效。
保持上下文较小：上下文是发送到生成器以处理构建的文件和目录指令。保持上下文尽可能小可以减少需要发送到构建器，并降低缓存的可能性失效。
使用绑定挂载：绑定挂载允许您挂载文件或目录中的 build 容器。使用 bind 挂载可以帮助您避免镜像中出现不必要的图层，这可能会减慢 build 过程。
使用缓存挂载：缓存挂载允许您指定在构建期间使用的持久包缓存。持久缓存有助于加快构建步骤，尤其是涉及使用一个 Package Manager 来执行。拥有包的持久缓存意味着即使您重新构建一个层，您只下载新的或更改的包。
使用外部缓存：外部缓存允许您将 build cache 存储在远程位置。外部缓存镜像可以是在多个 build 之间以及在不同的环境中共享。

对图层进行排序

将 Dockerfile 中的命令按逻辑顺序排列是一个很好的地方以开始。由于更改会导致后续步骤的重建，因此请尝试将昂贵的步骤出现在 Dockerfile 的开头附近。改变的步骤通常应出现在 Dockerfile 的末尾附近，以避免触发重新构建未更改的图层。

请考虑以下示例。运行 JavaScript 的 Dockerfile 代码段从当前目录中的源文件构建：

# syntax=docker/dockerfile:1
FROM node
WORKDIR /app
COPY . .          # Copy over all files in the current directory
RUN npm install   # Install dependencies
RUN npm build     # Run build

这个 Dockerfile 效率相当低下。更新任何文件都会导致重新安装所有依赖项，即使依赖项自上次以来没有改变。

相反，COPY命令可以一分为二。首先，复制 package 管理文件（在本例中为package.json和yarn.lock).然后，安装依赖关系。最后，复制项目源代码，即 subject 到频繁的变化。

# syntax=docker/dockerfile:1
FROM node
WORKDIR /app
COPY package.json yarn.lock .    # Copy package management files
RUN npm install                  # Install dependencies
COPY . .                         # Copy over project files
RUN npm build                    # Run build

通过在 Dockerfile 的早期层中安装依赖项，可以当项目文件发生更改时，无需重新构建这些图层。

保持上下文较小

确保上下文不包含不必要文件的最简单方法是要创建一个.dockerignore文件。这.dockerignorefile 的工作方式类似于.gitignore文件，并允许您从 build 上下文中排除 files 和 directories。

下面是一个示例.dockerignore文件中的node_modules目录中，所有文件和以tmp:

.dockerignore

node_modules
tmp*

Ignore-rules 在.dockerignore文件应用于整个构建 context，包括子目录。这意味着它是一个相当粗粒度的机制，但这是排除您知道的文件和目录的好方法在构建上下文中不需要临时文件、日志文件和构建工件。

使用绑定挂载

您可能熟悉 bind mounts，因为当您使用docker run或 Docker Compose 的 Docker Compose 中。绑定挂载允许您从 host machine 添加到容器中。

# bind mount using the -v flag
docker run -v $(pwd):/path/in/container image-name
# bind mount using the --mount flag
docker run --mount=type=bind,src=.,dst=/path/in/container image-name

要在构建中使用绑定挂载，您可以使用--mountflag 替换为RUN说明：

FROM golang:latest
WORKDIR /app
RUN --mount=type=bind,target=. go build -o /app/hello

在此示例中，当前目录已挂载到构建容器中在go build命令。源代码位于生成容器RUN指令。当指令执行完，挂载的文件不会持久化在最终的 image 或 build 缓存中。只有go build命令仍然。

这COPY和ADDinstructions 允许您从 build context 添加到构建容器中。使用 bind 挂载有利于构建缓存优化，因为您没有向缓存。如果你的 build 上下文偏大，并且它只被使用要生成工件，最好使用 Bind mounts 暂时将生成构件所需的源代码挂载到构建中。如果你用COPY要将文件添加到构建容器中，BuildKit 将包含所有，即使这些文件未在最终镜像中使用。

在 build 中使用 bind 挂载时，需要注意以下几点：

默认情况下，绑定挂载是只读的。如果需要写入挂载的目录中，您需要指定rw选择。但是，即使使用rw选项，则更改不会保留在最终镜像或构建缓存中。文件写入在RUNinstruction，以及在指令完成后被丢弃。
挂载的文件不会保留在最终镜像中。只有RUN指令将保留在最终镜像中。如果您需要包括文件，您需要使用COPY或ADD指示。
如果目标目录不为空，则目标目录的内容被挂载的文件隐藏。原始内容将在RUN指令完成。
例如，给定一个只有Dockerfile在其中：
. └── Dockerfile
以及将当前目录挂载到构建容器中的 Dockerfile：
FROM alpine:latest WORKDIR /work RUN touch foo.txt RUN --mount=type=bind,target=. ls RUN ls
第一个ls命令显示已挂载的目录。第二个ls列出原始生成上下文的内容。
构建日志
#8 [stage-0 3/5] RUN touch foo.txt #8 DONE 0.1s #9 [stage-0 4/5] RUN --mount=target=. ls -1 #9 0.040 Dockerfile #9 DONE 0.0s #10 [stage-0 5/5] RUN ls -1 #10 0.046 foo.txt #10 DONE 0.1s

使用缓存挂载

Docker 中的常规缓存层对应于指令的精确匹配以及它所依赖的文件。如果指令及其依赖的文件自构建层以来已更改，则层无效，并且构建进程必须重新构建层。

缓存挂载是指定要在建立。缓存在构建之间是累积的，因此您可以读取和写入 cache 多次缓存。这种持久缓存意味着，即使您需要 rebuild a layer，则只需下载新的或更改的包。任何未更改包将从缓存挂载中重用。

要在构建中使用缓存挂载，您可以使用--mountflag 替换为RUN说明：

FROM node:latest
WORKDIR /app
RUN --mount=type=cache,target=/root/.npm npm install

在此示例中，npm install命令将缓存挂载用于/root/.npmdirectory 中，npm 缓存的默认位置。缓存挂载在构建中保留，因此即使您最终重新构建了层，您仅下载新的或更改的软件包。对缓存的任何更改都会被持久化跨 build，并且缓存在多个 build 之间共享。

如何指定缓存挂载取决于您使用的构建工具。如果你是不确定如何指定缓存挂载，请参阅构建的文档工具。以下是一些示例：

RUN --mount=type=cache,target=/go/pkg/mod \
    go build -o /app/hello

RUN --mount=type=cache,target=/var/cache/apt,sharing=locked \
  --mount=type=cache,target=/var/lib/apt,sharing=locked \
  apt update && apt-get --no-install-recommends install -y gcc

RUN --mount=type=cache,target=/root/.cache/pip \
    pip install -r requirements.txt

RUN --mount=type=cache,target=/root/.gem \
    bundle install

RUN --mount=type=cache,target=/app/target/ \
    --mount=type=cache,target=/usr/local/cargo/git/db \
    --mount=type=cache,target=/usr/local/cargo/registry/ \
    cargo build

RUN --mount=type=cache,target=/root/.nuget/packages \
    dotnet restore

RUN --mount=type=cache,target=/tmp/cache \
    composer install

请务必阅读您正在使用的构建工具的文档以确保使用正确的缓存挂载选项。包管理器对于如何使用缓存有不同的要求，并且使用错误的选项可能会导致意外行为。例如，Apt 需要 exclusive 访问其数据，因此缓存使用选项sharing=locked确保使用相同缓存挂载的并行构建会相互等待，而不是访问相同的缓存文件。

使用外部缓存

构建的默认缓存存储是构建器内部的（BuildKit instance）的每个构建器都使用自己的缓存存储。当您在不同构建器之间切换，则缓存不会在它们之间共享。用外部缓存允许您定义用于推送和拉取的远程位置缓存数据。

外部缓存对于 CI/CD 管道特别有用，其中构建器通常是短暂的，构建时间很宝贵。在构建可以大大加快构建过程并降低成本。您甚至可以在本地开发环境中使用相同的缓存。

要使用外部缓存，请指定--cache-to和--cache-from选项替换为docker buildx build命令。

--cache-to将构建缓存导出到指定位置。
--cache-from指定 Build 要使用的远程缓存。

以下示例显示如何使用docker/build-push-action，然后将构建缓存层推送到 OCI 注册表镜像：

.github/workflows/ci.yml

name: ci

on:
  push:

jobs:
  docker:
    runs-on: ubuntu-latest
    steps:
      - name: Login to Docker Hub
        uses: docker/login-action@v3
        with:
          username: ${{ vars.DOCKERHUB_USERNAME }}
          password: ${{ secrets.DOCKERHUB_TOKEN }}

      - name: Set up Docker Buildx
        uses: docker/setup-buildx-action@v3

      - name: Build and push
        uses: docker/build-push-action@v6
        with:
          push: true
          tags: user/app:latest
          cache-from: type=registry,ref=user/app:buildcache
          cache-to: type=registry,ref=user/app:buildcache,mode=max

此设置告诉 BuildKit 在user/app:buildcache镜像。当构建完成后，新的构建缓存被推送到同一个镜像覆盖旧缓存。

此缓存也可以在本地使用。要在本地构建中拉取缓存，您可以使用--cache-from选项替换为docker buildx build命令：

$ docker buildx build --cache-from type=registry,ref=user/app:buildcache .

总结

优化构建中的缓存使用可以显著加快构建过程。保持构建上下文较小，使用 bind mounts、cache 挂载和外部缓存是您可以用来充分利用构建缓存和加快构建过程。

有关本指南中讨论的概念的更多信息，请参阅：