洞察和分析
Insights and analytics 为 Docker Verified 提供使用情况分析 Docker Hub 上的发布者 (DVP) 和 Docker 赞助的开源 (DSOS) 镜像。这包括在所需时间范围内自助访问镜像和扩展使用情况指标。您还可以按标签或摘要显示镜像提取的数量,并按地理位置、云提供商、客户端等获取细分。
提示
前往 Docker Verified Publisher Program 或 Docker 赞助的开源页面 以了解有关这些计划的更多信息。
查看镜像的分析数据
您可以在 Insights 和
分析控制面板,网址为: .仪表板包含一个
使用情况数据的可视化和可下载的表格
数据为 CSV 文件。https://hub.docker.com/orgs/{namespace}/insights/images
要查看图表中的数据,请执行以下操作:
- 选择数据粒度:每周或每月
- 选择时间间隔:3 个月、6 个月或 12 个月
- 在列表中选择一个或多个存储库
提示
将光标悬停在图表上会显示一个工具提示,其中显示了精确的数据 对于时间点。
共享分析数据
您可以使用图表上方的 Share (共享) 图标与他人共享可视化。 这是与组织中的其他人共享统计数据的便捷方式。
选择该图标会生成一个链接,该链接将复制到剪贴板。链接 保留您所做的显示选择。当有人点击该链接时,Insights and analytics (见解和分析) 页面将打开并显示具有相同 配置。
扩展分析数据
如果您已在扩展市场中发布了 Docker 扩展,则还可以获取有关扩展使用情况的分析,以 CSV 文件的形式提供。
您可以从以下 URL 的 Insights and analytics dashboard 下载扩展 CSV 报告:。如果您的 Docker 命名空间包含市场中已知的扩展,您将看到一个 Extensions (扩展) 选项卡,其中列出了您的扩展的 CSV 文件。https://hub.docker.com/orgs/{namespace}/insights/extensions
导出分析数据
您可以从 Web 控制面板或使用 DVP 数据 API 导出分析数据。组织的所有成员都可以访问分析数据。
数据以可下载的 CSV 文件的形式提供,每周一次(星期一至 Sunday) 或每月格式。月度数据从 下一个日历月。您可以将此数据导入到自己的系统中,也可以将 可以作为电子表格手动分析。
导出数据
按照以下步骤使用 Docker Hub 网站导出组织镜像的使用情况数据:
登录到 Docker Hub,然后选择 Organizations(组织)。
选择您的组织,然后选择 Insights and analytics(见解和分析)。
设置要导出分析数据的时间跨度。
摘要和原始数据的可下载 CSV 文件显示在右侧 边。
使用 API 导出数据
HTTP API 端点可在以下网址获得: 。了解如何导出数据
使用 DVP 数据 API 文档中的 API。https://hub.docker.com/api/publisher/analytics/v1
数据点
以原始格式或摘要格式导出数据。每种格式包含不同的数据 点和具有不同的结构。
以下部分介绍了每种格式的可用数据点。的 Date added 列显示首次引入字段的时间。
Image 拉取原始数据
原始数据格式包含以下数据点。CSV 文件中的每一行 表示镜像拉取。
数据点 | 描述 | 添加日期 |
---|---|---|
行动 | 请求类型,请参阅 操作分类规则。其中之一 , , .pull_by_tag pull_by_digest version_check | 1月 1, 2022 |
行动日 | 时间戳的日期部分:.YYYY-MM-DD | 1月 1, 2022 |
国家 | 请求原产国。 | 1月 1, 2022 |
消化 | 镜像摘要。 | 1月 1, 2022 |
HTTP 方法 | HTTP 方法,有关详细信息,请参阅 registry API 文档。 | 1月 1, 2022 |
主机 | 活动中使用的云服务提供商。 | 1月 1, 2022 |
Namespace | Docker 组织(镜像命名空间)。 | 1月 1, 2022 |
参考 | 请求中使用的镜像摘要或标记。 | 1月 1, 2022 |
存储 库 | Docker 存储库(镜像名称)。 | 1月 1, 2022 |
标记(可用时包含) | 标签名称,仅当请求引用标签时才可用。 | 1月 1, 2022 |
时间戳 | 请求的日期和时间:。YYYY-MM-DD 00:00:00 | 1月 1, 2022 |
类型 | 事件源自的行业。、 、 、 、 之一。business isp hosting education null | 1月 1, 2022 |
用户代理工具 | 用户用于提取镜像的应用程序(例如 或 )。docker containerd | 1月 1, 2022 |
用户代理版本 | 用于拉取镜像的应用程序版本。 | 1月 1, 2022 |
域 | 请求源域,请参见 隐私。 | 10月 11, 2022 |
所有者 | 拥有仓库的组织的名称。 | 12月 19, 2022 |
镜像提取摘要数据
有两个级别的摘要数据可用:
- 存储库级别,每个命名空间和存储库的摘要
- 标签或摘要级别,每个命名空间、存储库和引用的摘要 (标签或摘要)
摘要数据格式包含所选时间的以下数据点 跨度:
数据点 | 描述 | 添加日期 |
---|---|---|
唯一 IP 地址 | 唯一 IP 地址的数量,请参阅隐私。 | 1月 1, 2022 |
按标签拉取 | GET 请求,按摘要或标签。 | 1月 1, 2022 |
按摘要提取 | 按摘要请求 GET 或 HEAD 请求,或按摘要请求 HEAD。 | 1月 1, 2022 |
版本检查 | HEAD 按标签,而不是后跟 GET | 1月 1, 2022 |
所有者 | 拥有仓库的组织的名称。 | 12月 19, 2022 |
镜像拉取操作分类规则
一个操作表示与 .拉取按类别分组,以使数据更有意义
了解用户行为和意图。这些类别是:docker pull
- 版本检查
- 按标签拉取
- 按摘要提取
自动化系统经常检查镜像的新版本。能够 来区分 CI 中的“版本检查”与实际的镜像拉取 用户可让您更深入地了解用户的行为。
下表描述了用于确定背后的意图的规则 拉。要提供反馈或询问有关这些规则的问题,请填写 Google 表单。
开始事件 | 参考 | 其次 | 结果操作 | 使用案例 | 笔记 |
---|---|---|---|---|---|
头 | 标记 | 不适用 | 版本检查 | 用户已在本地计算机上存在所有层 | 这类似于按标记提取的用例,当用户已经在本地存在所有镜像层时,它会区分用户意图并相应地进行分类。 |
获取 | 标记 | 不适用 | 按标签拉取 | 用户已在本地计算机上存在所有层和/或镜像是单架构 | |
获取 | 标记 | 按不同的摘要获取 | 按标签拉取 | 镜像是多拱形的 | 第二个 GET by digest 必须与第一个不同。 |
头 | 标记 | GET by same digest (按同一摘要获取) | 按标签拉取 | 镜像是多架构的,但本地计算机上已存在部分或全部镜像层 | HEAD by 标签发送最新的摘要,以下 GET 必须由同一摘要发送。如果镜像是多架构的,则可能会出现额外的 GET(请参阅此表中的下一行)。如果用户不需要最新的摘要,则用户将逐个执行 HEAD。 |
头 | 标记 | GET,然后是另一个摘要的第二个 GET | 按标签拉取 | 镜像是多拱形的 | HEAD by 标签发送最新的摘要,以下 GET 必须由同一摘要发送。由于镜像是多架构的,因此不同的摘要会有第二个 GET。如果用户不需要最新的摘要,则用户将逐个执行 HEAD。 |
头 | 标记 | GET 命令,然后是不同摘要的第二个 GET 命令 | 按标签拉取 | 镜像是多拱形的 | HEAD by 标签发送最新的摘要,以下 GET 必须由同一摘要发送。由于镜像是多架构的,因此不同的摘要会有第二个 GET。如果用户不需要最新的摘要,则用户将逐个执行 HEAD。 |
获取 | 消化 | 不适用 | 按摘要提取 | 用户已在本地计算机上存在所有层和/或镜像是单架构 | |
头 | 消化 | 不适用 | 按摘要提取 | 用户已在其本地计算机上存在所有层 | |
获取 | 消化 | 按不同的摘要获取 | 按摘要提取 | 镜像是多拱形的 | 第二个 GET by digest 必须与第一个不同。 |
头 | 消化 | GET by same digest (按同一摘要获取) | 按摘要提取 | 镜像是单架构和/或镜像是多架构,但镜像的某些部分已存在于本地计算机上 | |
头 | 消化 | GET 命令,然后是不同摘要的第二个 GET 命令 | 按 Digest 提取 | 镜像是多拱形的 |
扩展摘要数据
有两个级别的扩展摘要数据可用:
- 核心摘要,包含基本的扩展使用信息:扩展安装数、卸载数和所有时间的总安装
core-summary-data 文件包含所选时间的以下数据点 跨度:
数据点 | 描述 | 添加日期 |
---|---|---|
安装 | 扩展的安装数 | 2月 1, 2024 |
总安装量 | 扩展的所有安装数 | 2月 1, 2024 |
卸载 | 扩展的卸载次数 | 2月 1, 2024 |
总卸载量 | 扩展的所有时间卸载次数 | 2月 1, 2024 |
更新 | 扩展的更新数 | 2月 1, 2024 |
- 高级摘要,包含高级扩展使用信息:安装、唯一用户卸载、唯一用户打开扩展。
core-summary-data 文件包含所选时间的以下数据点 跨度:
数据点 | 描述 | 添加日期 |
---|---|---|
安装 | 扩展的安装数 | 2月 1, 2024 |
UniqueInstalls (唯一安装) | 安装扩展的唯一用户数 | 2月 1, 2024 |
卸载 | 扩展的卸载次数 | 2月 1, 2024 |
UniqueUninstalls (唯一卸载) | 卸载扩展的唯一用户数 | 2月 1, 2024 |
用法 | 扩展选项卡的打开数 | 2月 1, 2024 |
UniqueUsers (唯一用户) | 打开扩展选项卡的唯一用户数 | 2月 1, 2024 |
数据随时间的变化
洞察和分析服务不断改进,以提高 它为出版商带来的价值。某些更改可能包括添加新数据 点,或者改进现有数据以使其更有用。
数据集中的更改(例如添加或删除的字段)通常仅适用于 从首次引入该字段的日期开始,一直持续到以后。
请参阅 Data points 部分中的表格,查看来自哪些 给定数据点可用的日期。
隐私
本节包含有关隐私保护措施的信息,这些措施可确保 Docker Hub 上内容的使用者保持完全匿名。
重要
Docker 绝不会共享任何个人身份信息 (PII) 分析数据。
镜像提取摘要数据集包括唯一的 IP 地址计数。仅此数据点 包括请求镜像的不同唯一 IP 地址的数量。 单个 IP 地址永远不会共享。
镜像拉取原始数据集包括用户 IP 域作为数据点。这是域名
与用于拉取镜像的 IP 地址相关联。如果 IP 类型为 ,则域表示与 关联的公司或组织
该 IP 地址(例如 )。对于不是 的任何其他 IP 类型,域表示 Internet 服务提供商或托管
provider 来发出请求。平均而言,只有大约 30% 的拉取
分类为 IP 类型(这因发布者和镜像而异)。business
docker.com
business
business