DeepSeek 文生图模型 Janus-Pro-7B 的使用

更新时间：2025-02-06 09:41:33

背景信息

Janus-Pro-7B webUI 版文生图模型，支持 Multimodal Understanding 和 Text-to-Image Generation 两种服务，可通过智算平台容器实例直接使用。同时，模型文件存放在系统盘，用户也可通过 Jupyter 进行算法二次开发使用。

Janus-Pro 是统一的多模态理解和生成式的 MLLM 模型，通过将视觉编码解耦实现多模态任务的理解和生产，Janus-Pro 基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建。对于多模态理解，Janus-Pro 使用 SigLIP-L 作为视觉编码器，支持 384x384 图像输入。对于图像生成，它使用 tokenizer Janus-Series，支持采样率为 16，提升了图形质量。

前提条件

已经获取基石智算控制台账户和密码。
已完成实名认证且账户余额大于 0 元。

操作步骤

创建容器实例

登录控制台，默认进入 AI 计算平台。
在左侧导航栏，点击镜像仓库，选择应用镜像页签。
在 DeepSeek 镜像卡片页，选定 Jauns-Pro-7B 模型，点击创建容器实例。
在创建容器实例页面中，根据如下要求配置各项参数，点击创建。
- 资源类型：以西北三区为例，选择单卡 NVIDIA-RTX-4090-D 24G GPU 资源即可。
- 镜像：已选择上一步选定的应用镜像。
- 其他参数，根据实际情况进行设定或保持默认即可。
等待容器实例创建完成，且状态为运行中。

启动并使用 DeepSeek Janus-Pro 服务

在容器实例列表中，点击相应实例的更多访问。
在更多访问信息窗口中，点击开放端口 9001 所对应的地址即可启动服务。

注意

若无法打开页面，请稍等 1 分钟左右，等待服务启动完成。
参考以下示图，即可使用 DeepSeek Janus-Pro。

注意
若无法打开页面，请稍等 1 分钟左右，等待服务启动完成。

使用 Jupyter 进行算法二次开发

在容器实例列表中，点击相应实例的快捷开发 > jupyter。

说明

Jupyter 的使用方法可参考前文内容。
在 JupyterLab 页面，打开 Terminal 终端，执行如下命令进入相应目录后，即可查看 Janus-Pro-7B 模型文件。
```
cd /DeepSeek/deepseek-ai/Janus-Pro-7B
```