前提条件

  • 训练任务已创建。

  • 训练任务的状态为运行中运行完成

  • 用户已编写代码将相关日志写入环境变量 TENSORBOARD_LOG_PATH 所对应路径。

单个任务 TensorBoard

  1. 登录基石智算控制台,进入AI 算力云服务。

  2. 在左侧导航栏,选择分布式训练,默认进入分布式训练任务列表页面。

  3. 在分布式训练列表页面,点击指定任务所在行右侧操作列中的 TensorBoard

    注意
    • 待查看的任务状态必须处于运行中,或已运行完成。

    • 若无法打开 TensorBoard 页面,请检查浏览器弹窗拦截是否关闭。

多个任务 TensorBoard 对比

  1. 在分布式训练列表页面,勾选多个训练任务。

  2. 点击列表上方的启动 TensorBoard 对比,在弹出的 TensorBoard 页面即可查看。

    develop training job tensorboard 1
    说明

    更多相关信息,可查阅 TensorBoard 官方教程