使用腾讯云 Ti-one 部署
在腾讯云 Ti-one 平台上部署 Youtu-RAG 后端服务的指南
本文档提供了在腾讯云 Ti-one 平台上部署 Youtu Embedding、Youtu HiChunk 和 Youtu Parsing 后端服务的说明。
概述
腾讯云 Ti-one 是一个一站式机器学习平台,提供模型训练、部署和推理服务。使用 Ti-one,你可以在不管理自己的 GPU 基础设施的情况下部署 Youtu-RAG 后端服务。
前提条件
- 拥有 Ti-one 和腾讯云容器镜像服务(TCR)访问权限的腾讯云账户
在 Ti-one 上部署服务
步骤 1: 准备容器镜像
- 按照各后端服务的相应 Docker 部署指南构建 Docker 镜像
- 将 Docker 镜像上传到腾讯云容器镜像服务(TCR)。你可以按照 TCR 文档的说明将镜像推送到 TCR。
步骤 2: 创建模型服务
步骤 3: 配置模型
- 服务名称: 为你的服务输入名称(例如,
youtu-embedding) - 部署方式: 选择标准部署
- 资源来源: 如果你有现有实例,选择从 CVM 选择,或选择在 TI-ONE 上购买创建新实例
- 模型来源: 选择容器镜像,并选择你刚刚上传到腾讯云容器镜像服务(TCR)的容器镜像
- 端口: 默认为 8501,或指定与你的容器配置匹配的自定义端口
- 规格: 选择一个 GPU 实例
步骤 4: 更新服务端点
- 创建服务后,导航到服务详情页面
- 在服务调用部分的常规服务调用下找到并复制调用地址。这将是你用于 Youtu-RAG 集成的服务端点。
配置 Youtu-RAG
一旦所有服务都在 Ti-one 上部署完成,使用 Ti-one 服务端点更新你的 .env 文件。你还需要检查你的 RAG 配置文件,如本地部署指南中所示,以确保兼容性。
