在 RAGFlow 中的使用 - AI 智算产品文档

本文将以智算平台上大模型服务中的 DeepSeek-R1-Distill-Qwen-7B、bce-embedding-base_v1 为例，向用户介绍如何在 RAGFlow 中添加并使用平台提供的模型服务。

背景信息

RAGFlow 是一款基于深度文档理解的开源检索增强生成（Retrieval-Augmented Generation，RAG）引擎。旨在通过深度文档理解技术，解决现有 RAG 技术在数据处理和生成答案方面的挑战。

RAGFlow 具有如下功能特点：

进入大模型服务管理页面，在左侧导航栏中选择 API 密钥管理，用户可直接获取 API 域名和API 路径，点击相应按钮即可创建和获取 API 密钥。

说明

说明
当前平台上的预置模型的 API 域名为 `https://openapi.coreshub.cn/v1`，用户可直接使用无需修改。若平台内无可用的 API 密钥，用户可参考前文内容创建和获取新的 API 密钥。若平台内已有可用的 API 密钥，用户可直接将鼠标悬停在指定密钥上，点击 API 密钥右侧的复制按钮，即可获取完整的 API 密钥。

在弹出的添加 LLM 窗口中，配置各项参数，点击确定即可。

注意
每次只能添加一种模型类型，即 chat 和 embedding 模型不能同时添加。如需添加不同类型模型，可完成一种模型的添加后，选中相应的模型供应商后，点击添加模型，进行再一次的添加。

注意

模型类型：根据待添加的模型，选择相应的类型。若添加 DeepSeek-R1-Distill-Qwen-7B 模型则选择 chat，若添加 bce-embedding-base_v1 模型则选择 embedding。
模型名称：填写待添加模型的名称即可，若需使用平台内其他模型，用户仅需在智算平台的在线推理服务页面，复制得到相应模型名称即可。
基础 url：直接填写 https://openapi.coreshub.cn/v1 即可。
API-Key：用户在获取 API 密钥和域名操作中复制得到的完整 API 密钥，需根据实际情况进行修改。
最大 token 数：填根据所选择模型所支持的最大数量填写。
其他参数，根据实际情况进行设置或保持默认即可。

延续上述操作，在顶部导航栏选择聊天页签，并点击新建助理。
在聊天配置页签中，完成助理设置各项参数的配置，点击确定。
- 助理姓名：用户自定义。
- 设置开场白：用于设置聊天助理回复问题时的首句话，用户自定义。
- 知识库：选择前文新建的知识库即可。
- 其他参数，用户根据实际情况进行修改或保持默认即可。
进入提示引擎设置页签，配置更多信息，此配置为可选项，用户可根据实际情况进行修改或保持默认，配置完成后，点击确定。
进入模型设置页签，模型参数选择前文中添加的大语言模型，其他参数根据实际情况进行修改或保持默认，点击确定。
返回聊天页面，选择新建的聊天助理，点击 + ，发起新的聊天窗口，即可进行对话。