监控总览页面,展示了当前管理平台内集群卡分配、容器组、命令空间的基本信息。

boss monitor overview 1

查看监控总览

  1. 登录 AI 智算运维管理端。

  2. 在左侧导航栏选择监控管理 > 总览,即可进入监控总览页面。

  3. 顶部集群卡分配情况卡片页展示了当前集群中的总节点数总卡数空闲卡数以及不可用卡数,选择该卡片页即可查看相应的详细信息。

  4. 运行中的容器组卡片页展示了当前集群中容器实例分布式训练以及推理服务各项任务所使用的容器组的基本信息。

  5. 命令空间卡片页展示了当前集群中,总命名空间的数量以及当日新增命名空间的数量。

    说明

    每一个命名空间对应一个 Console 用户端的账户。