Youtu HiChunk
使用 Docker 部署
本文档提供构建包含所有模型权重和依赖项的自包含 Youtu HiChunk Docker 镜像的说明。
环境要求:
- 系统已安装 Docker
- 足够的磁盘空间(镜像约 10GB)
- 支持 CUDA 12.x 的 NVIDIA GPU(用于运行容器)
设置构建目录
首先,创建用于构建 Docker 镜像的目录并下载模型权重:
创建自定义 vLLM 模型文件
Youtu HiChunk 需要在 vLLM 中注册自定义模型文件。在构建目录中创建以下文件。
utu_v1.py
创建名为 utu_v1.py 的文件,包含 Youtu HiChunk 模型实现。您可以从下载的 Youtu-HiChunk 目录或本地部署指南复制此文件。
registry.py
创建名为 registry.py 的文件,包含更新的 vLLM 模型注册表。您可以从下载的 Youtu-HiChunk 目录或本地部署指南复制此文件。
创建 Dockerfile
创建名为 Dockerfile 的文件,内容如下:
构建 Docker 镜像
使用以下命令构建 Docker 镜像:
此过程可能需要几分钟,因为它会下载基础镜像并复制模型权重。
运行 Docker 容器
使用 GPU 支持运行容器:
您也可以通过覆盖 CMD 来自定义服务器参数:
推送到容器注册表
要在远程机器上部署,请将镜像推送到容器注册表:
在远程机器上运行
在远程机器上,拉取并运行镜像:
Youtu HiChunk 服务将在 http://<remote-machine-ip>:8501 可用。
最终目录结构
构建前,您的 hichunk-docker 目录应具有以下结构:
