背景信息

Janus-Pro-7B webUI 版文生图模型,支持 Multimodal Understanding 和 Text-to-Image Generation 两种服务,可通过智算平台容器实例直接使用。同时,模型文件存放在系统盘,用户也可通过 Jupyter 进行算法二次开发使用。

Janus-Pro 是统一的多模态理解和生成式的 MLLM 模型,通过将视觉编码解耦实现多模态任务的理解和生产,Janus-Pro 基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建。对于多模态理解,Janus-Pro 使用 SigLIP-L 作为视觉编码器,支持 384x384 图像输入。对于图像生成,它使用 tokenizer Janus-Series,支持采样率为 16,提升了图形质量。

help janus pro 1

前提条件

  • 已经获取基石智算控制台账户和密码。

  • 已完成实名认证且账户余额大于 0 元。

操作步骤

创建容器实例

  1. 登录控制台,默认进入 AI 计算平台。

  2. 在左侧导航栏,点击镜像仓库,选择应用镜像页签。

  3. DeepSeek 镜像卡片页,选定 Jauns-Pro-7B 模型,点击创建容器实例

    help janus pro 2
  4. 创建容器实例页面中,根据如下要求配置各项参数,点击创建

    • 资源类型:以西北三区为例,选择单卡 NVIDIA-RTX-4090-D 24G GPU 资源即可。

    • 镜像:已选择上一步选定的应用镜像。

    • 其他参数,根据实际情况进行设定或保持默认即可。

  5. 等待容器实例创建完成,且状态为运行中

启动并使用 DeepSeek Janus-Pro 服务

  1. 在容器实例列表中,点击相应实例的更多访问

    help janus pro 3
  2. 更多访问信息窗口中,点击开放端口 9001 所对应的地址即可启动服务。

    注意

    若无法打开页面,请稍等 1 分钟左右,等待服务启动完成。

    help janus pro 4
  3. 参考以下示图,即可使用 DeepSeek Janus-Pro。

    help janus pro 6
    help janus pro 7
    help janus pro 8

使用 Jupyter 进行算法二次开发

  1. 在容器实例列表中,点击相应实例的快捷开发 > jupyter

    说明

    Jupyter 的使用方法可参考前文内容

  2. 在 JupyterLab 页面,打开 Terminal 终端,执行如下命令进入相应目录后,即可查看 Janus-Pro-7B 模型文件。

    cd /DeepSeek/deepseek-ai/Janus-Pro-7B
    help janus pro 5