模型部署 - AI 智算产品文档

模型部署

更新时间：2025-12-26 09:58:41

此操作是将已创建的模型或其指定版本的模型部署成推理服务。

前提条件

根据页面提示，配置各项参数，点击确定，等待推理服务创建完成即可。

参数说明

参数	说明
服务名称	选填项，当前推理服务的名称，由用户自定义。
模型来源	默认为自定义模型。
模型名称	用户添加模型时已经提前设置好的名称，系统自动获取。
部署方式	根据用户选定的模型，系统将自动获取相应的部署方式。若有多种部署方式，根据实际需要选择即可。同时，用户也可选择单节点或分布式。 `单节点`：针对单个节点即可部署和启动的模型，最多可选择 8 卡。 `分布式`：若当前模型单个节点无法启动，可选择多个节点部署一个推理实例。
数量	用户可根据实际需要，设置推理实例总数和单推理实例节点数。 `推理实例总数`：当前创建的推理服务中所包含推理实例（副本）的个数。 `单推理实例节点数`：每个推理实例（副本）中所包含节点数。
API Key	是否为推理服务创建 API Key。目前，仅大语言模型支持创建 API Key，OCR 模型暂不支持。
更多配置	仅在添加模型时开启了允许用户部署中修改按钮，才会有该选项。支持用户对`环境变量`、`启动命令`、`第三方依赖`以及`网络端口`进行修改。
资源配置	针对当前模型部署所需的资源配置，用户可根据实际情况选择相应的资源类型及配置。

服务名称

选填项，当前推理服务的名称，由用户自定义。

模型来源

默认为自定义模型。

模型名称

用户添加模型时已经提前设置好的名称，系统自动获取。

部署方式

根据用户选定的模型，系统将自动获取相应的部署方式。若有多种部署方式，根据实际需要选择即可。同时，用户也可选择单节点或分布式。

数量

用户可根据实际需要，设置推理实例总数和单推理实例节点数。

API Key

是否为推理服务创建 API Key。目前，仅大语言模型支持创建 API Key，OCR 模型暂不支持。

更多配置

仅在添加模型时开启了允许用户部署中修改按钮，才会有该选项。

支持用户对环境变量、启动命令、第三方依赖以及网络端口进行修改。

资源配置

针对当前模型部署所需的资源配置，用户可根据实际情况选择相应的资源类型及配置。