针对某一专属节点,通过开启共享 GPU 功能,可实现多个容器实例(pod)调用相同的 GPU 卡进行使用,所有的 pod 都可以向 GPU 卡创建调用线程,共享后完成配置共享调度规格即可使用。

前提条件

开启 GPU 共享

  1. 登录基石智算控制台,进入 AI 计算平台。

  2. 在左侧导航栏,选择专属资源组,进入资源组列表页面。

  3. 选择专属节点页签,在指定节点的操作列中,点击共享 GPU

    res manage share gpu 1
  4. 在弹出的提示框中,确认信息无误后,点击确定即可。

  5. 完成 GPU 共享后,进行共享调度规格配置

关闭 GPU 共享

  1. 进入专属资源组页面。

  2. 专属节点页签,点解指定节点的操作列中的取消共享 GPU

    res manage share gpu 2
  3. 在弹出的提示框中,确认信息无误后,点击确定即可。