概览页面从基本信息、集群配额统计、节点资源用量、资源用量排行、容器组等多维度对 AI 智算平台总体数据进行展示。

前提条件

以获取管理端登录账号与密码。

操作步骤

  1. 登录 AI 智算运维管理端。

  2. 在左侧导航栏选择概览,即可进入管理端的概览页面。

    boss overview
  3. 运维管理人员可在概览页面,查看相关信息。

    功能区 描述

    集群配额统计

    当前集群中容器和项目的 CPU 配额和内存配额,包含预留数量、上限数量和总量。

    节点资源用量

    所有节点的 CPU、内存、磁盘的总量和实时用量,以及集群允许创建的容器组总数和已创建的容器组数量。

    容器组

    当前集群的各种类型容器组的数量。

    容器组状态类型包括:

    • 运行中:容器组已分配给某个节点,容器组中的所有容器都已被创建,至少有一个容器正在运行、启动或重启。

    • 等待中:容组器已被系统接受,但有至少一个容器尚未创建也未运行。此状态下,容器组可能正在等待调度,或等待容器镜像下载完成。

    • 已完成:容器组中的所有容器都成功终止(以 0 退出码终止),并且不再重启。

    • 失败:容器组中的所有容器都已终止,并且至少有一个容器以非 0 退出码终止。

    • 未知:系统无法获取容器组状态。出现这种状态通常是由于系统与容器组所在的主机通信失败。

    容器组 QoS(服务质量)类型包括:

    • Guaranteed:容器组中的每个容器都具有内存上限、内存请求、CPU 上限、CPU 请求,并且内存上限等于内存请求,CPU 上限等于 CPU 请求。

    • Burstable:容器组中至少有一个容器不满足 Guaranteed 类型的要求。

    • BestEffort:容器组中的容器没有配置任何内存上限、内存请求、CPU 上限或CPU 请求。

    容器组的 QoS 类型将决定容器组运行的优先级。当系统中资源不足以运行所有容器组时,系统优先保证运行 QoS 类型为 Guaranteed 的容器组,其次保证运行 QoS 类型为 Burstable 的容器组,最后保证运行 QoS 类型为 BestEffort 的容器组。

    基本信息/工具

    • 基本信息:显示当前管理端所管理的主集群信息、提供商、Kubernetes 版本及状态、KubeSphere 企业版版本和对企业空间的可见性。

    • 工具:

      • kubectl 命令行工具,用于控制当前集群。

      • kubeconfig 配置文件,用于配置当前集群的访问信息。

    资源用量排行

    默认显示当前集群中特定资源用量最高的 5 个节点、容器组或项目。

    • 在左侧下拉列表中选择节点、容器组或项目,在右侧下拉列表中选择不同的排序依据。

    • 在列表上方点击sort-ascending/sort-descending 可按升序/降序排序。

    • 点击查看更多,可直接查看完整的资源用量排行。