查看节点监控
更新时间:2025-05-23 05:48:51
前提条件
以获取管理端登录账号与密码。
操作步骤
-
登录 AI 智算运维管理端。
-
在左侧导航栏选择集群管理 > 节点管理,进入节点管理页面。
-
点击节点监控页签,在当前页面可查看所有节点的基本监控信息。
参数 描述 节点名称
各节点的主机名称,以及在子网内部的 IP 地址。
状态
各节点的运行状态。
-
运行中:节点运行正常。
-
无法调度:节点被用户手动设置为不可调度。如果节点处在此状态,容器组将不能被调度到该节点。
-
告警:节点上存在告警。您可以在节点详情页面的运行状态 > 健康状态区域查看节点的告警类型。
如果节点上存在污点,状态列还将显示节点上污点的数量。您可以将光标悬停在污点数字上查看污点的具体信息。有关更多信息,请参阅设置节点污点。
角色
各节点在集群中的角色,取值为控制平面节点、工作节点或边缘节点。
CPU 用量
各节点的 CPU 核总数、已使用 CPU 核数量和已使用 CPU 核百分比。已使用 CPU 核数量包含底层系统使用的 CPU 核数量。
内存用量
各节点的内存总大小、已使用内存大小和已使用内存的百分比。已使用内存大小包含底层系统使用的内存大小。
容器组
各节点上可创建容器组的总数、已创建容器组的数量与可创建容器组的占比。
已分配 CPU
各节点预留的 CPU 资源、预留 CPU 资源相对可分配资源数量的百分比。
已分配内存
各节点预留的内存资源、预留内存资源相对可分配资源数量的百分比。
-
-
在列表右上角点击
可手动刷新数据。
-
在列表右上角点击
可定制列表中显示的信息。
-
在搜索框中输入关键字可对列表进行筛选。