本章节主要介绍如何使用 SwanLab 镜像创建容器实例。

前提条件

  • 已经获取基石智算控制台账户和密码。

  • 已完成实名认证且账户余额大于 0 元。

操作步骤

  1. 登录基石智算控制台,进入 AI 计算平台。

  2. 在左侧导航栏,点击镜像仓库,选择应用镜像页签。

  3. 应用镜像列表中,选择 SwanLab 镜像卡片页,且选择版本号为 0.3.26,点击创建容器实例

    bp swanlab
  4. 进入创建容器实例页面,按如下要求配置各项参数,点击创建即可。

    • 资源类型:选择 GPU 节点即可。

    • 环境变量:点击添加输入 SWANLAB_API_KEY输入 SWAN_API_KEY。

      SWAN_API_KEY 可在 SwanLab 官网注册账号后获取,已注册的用户,可在设置中查看 API Key。

    • 镜像:已根据上一步操作,选定为应用镜像下的 SWANLAB 镜像。

    • 其他参数,根据实际情况进行设定即可。

  5. 等待容器实例创建完成,且状态为运行中,点击该容器实例快捷开发列中的 jupyter,打开 JupyterLab 页面。

    bp swanlab k8s 1
  6. 在 JupyterLab 页面,选择 Other > Python File,新建 .py 文件。

    bp swanlab k8s 2
  7. 将上一步新建的 .py 文件,重命名为 swan.py,写入以下代码内容并保存。

    # swan-lab.py
    import swanlab
    import random
    
    # 初始化一个新的swanlab run类来跟踪这个脚本
    swanlab.init(
      # 设置将记录此次运行的项目信息
      project="my-awesome-project",
    
      # 跟踪超参数和运行元数据
      config={
        "learning_rate": 0.02,
        "architecture": "CNN",
        "dataset": "CIFAR-100",
        "epochs": 10
      }
    )
    
    # 模拟训练
    epochs = 10
    offset = random.random() / 5
    for epoch in range(2, epochs):
      acc = 1 - 2 ** -epoch - random.random() / epoch - offset
      loss = 2 ** -epoch + random.random() / epoch + offset
    
      # 向swanlab上传训练指标
      swanlab.log({"acc": acc, "loss": loss})
    
    # [可选] 完成训练,这在notebook环境中是必要的
    swanlab.finish()
  8. 在 JupyterLab 页面,选择 Other > Terminal,打开一个新终端,直接输入如下命令。

    python3 swan.py
    bp swanlab k8s 3
  9. 待命令执行完成,点击相应链接跳转至 SwanLab 网页,选定相应实验,并查看环境,即可查看到当前云厂商基石智算

    bp swanlab k8s 4