DeepSeek 文生图模型 Janus-Pro-7B 的使用
背景信息
Janus-Pro-7B webUI 版文生图模型,支持 Multimodal Understanding 和 Text-to-Image Generation 两种服务,可通过智算平台容器实例直接使用。同时,模型文件存放在系统盘,用户也可通过 Jupyter 进行算法二次开发使用。
Janus-Pro 是统一的多模态理解和生成式的 MLLM 模型,通过将视觉编码解耦实现多模态任务的理解和生产,Janus-Pro 基于 DeepSeek-LLM-1.5b-base/DeepSeek-LLM-7b-base 构建。对于多模态理解,Janus-Pro 使用 SigLIP-L 作为视觉编码器,支持 384x384 图像输入。对于图像生成,它使用 tokenizer Janus-Series,支持采样率为 16,提升了图形质量。

前提条件
-
已经获取基石智算控制台账户和密码。
-
已完成实名认证且账户余额大于 0 元。
操作步骤
创建容器实例
-
登录控制台,默认进入 AI 计算平台。
-
在左侧导航栏,点击镜像仓库,选择应用镜像页签。
-
在 DeepSeek 镜像卡片页,选定 Jauns-Pro-7B 模型,点击创建容器实例。
-
在创建容器实例页面中,根据如下要求配置各项参数,点击创建。
-
资源类型
:以西北三区为例,选择单卡 NVIDIA-RTX-4090-D 24G GPU 资源即可。 -
镜像
:已选择上一步选定的应用镜像。 -
其他参数,根据实际情况进行设定或保持默认即可。
-
-
等待容器实例创建完成,且状态为
运行中
。
启动并使用 DeepSeek Janus-Pro 服务
-
在容器实例列表中,点击相应实例的更多访问。
-
在更多访问信息窗口中,点击开放端口
9001
所对应的地址即可启动服务。注意 若无法打开页面,请稍等 1 分钟左右,等待服务启动完成。
-
参考以下示图,即可使用 DeepSeek Janus-Pro。
使用 Jupyter 进行算法二次开发
-
在容器实例列表中,点击相应实例的快捷开发 > jupyter。
说明 Jupyter 的使用方法可参考前文内容。
-
在 JupyterLab 页面,打开 Terminal 终端,执行如下命令进入相应目录后,即可查看 Janus-Pro-7B 模型文件。
cd /DeepSeek/deepseek-ai/Janus-Pro-7B