前提条件

以获取管理端登录账号与密码。

操作步骤

  1. 登录 AI 智算运维管理端。

  2. 在左侧导航栏选择集群管理 > 节点管理,进入节点管理页面。

  3. 点击节点监控页签,在当前页面可查看所有节点的基本监控信息。

    参数 描述

    节点名称

    各节点的主机名称,以及在子网内部的 IP 地址。

    状态

    各节点的运行状态。

    • 运行中:节点运行正常。

    • 无法调度:节点被用户手动设置为不可调度。如果节点处在此状态,容器组将不能被调度到该节点。

    • 告警:节点上存在告警。您可以在节点详情页面的运行状态 > 健康状态区域查看节点的告警类型。

    如果节点上存在污点,状态列还将显示节点上污点的数量。您可以将光标悬停在污点数字上查看污点的具体信息。有关更多信息,请参阅设置节点污点

    角色

    各节点在集群中的角色,取值为控制平面节点工作节点边缘节点

    CPU 用量

    各节点的 CPU 核总数、已使用 CPU 核数量和已使用 CPU 核百分比。已使用 CPU 核数量包含底层系统使用的 CPU 核数量。

    内存用量

    各节点的内存总大小、已使用内存大小和已使用内存的百分比。已使用内存大小包含底层系统使用的内存大小。

    容器组

    各节点上可创建容器组的总数、已创建容器组的数量与可创建容器组的占比。

    已分配 CPU

    各节点预留的 CPU 资源、预留 CPU 资源相对可分配资源数量的百分比。

    已分配内存

    各节点预留的内存资源、预留内存资源相对可分配资源数量的百分比。

  4. 在列表右上角点击 refresh 可手动刷新数据。

  5. 在列表右上角点击 cogwheel 可定制列表中显示的信息。

  6. 在搜索框中输入关键字可对列表进行筛选。