环境变量
本文档概述了 Youtu-RAG 中关键环境变量的配置
概述
在运行 Youtu-RAG 之前,你需要配置必要的环境变量。推荐的做法是从项目根目录复制 .env.example 文件开始:
然后,编辑 .env 文件以填写所需的 API Keys 和其他配置。
Web UI
Youtu-RAG Web 界面可以使用以下设置进行配置:
LLM API Keys
Youtu-RAG 的核心能力依赖于大型语言模型(LLM)。你需要为不同的功能模块配置适当的模型。这是智能体操作所依赖的主要文本生成 LLM。
工具
一些工具包需要自己的 API Keys 或特定配置。
搜索工具包(SearchToolkit)
搜索工具包默认集成以下两个服务:
- 网页搜索: 使用 Serper 提供的高效 Google 搜索 API。你需要注册并获取 API Key。
- 网页内容提取: 使用 Jina AI Reader 将网页内容转换为 LLM 友好的 Markdown 格式。这也需要注册和 API Key。
在你的 .env 文件中进行如下配置:
OCR 工具包(Youtu-Parsing)
Youtu-RAG 集成了用于从图像和文档中提取文本的 OCR 服务:
Embedding 工具包(Youtu-Embedding)
Youtu-RAG 支持两种嵌入服务选项:
选项 1: 本地 Youtu-Embedding 服务(2048 维度)
选项 2: 其他 Embedding 服务
Reranker 工具包(Jina-Reranker)
重排序服务用于通过重新排序搜索结果来提高检索准确性:
数据库
向量数据库
Youtu-RAG 使用 ChromaDB 作为向量数据库来存储文档嵌入:
关系型数据库
关系型数据库用于系统管理、存储追踪数据和评估结果:
你也可以通过相应修改连接 URL 来使用其他数据库系统(例如,PostgreSQL、MySQL)。
MinIO
MinIO 用作对象存储来管理 RAG 相关文件:
追踪与监控
框架集成了 OpenTelemetry 和 Phoenix 用于追踪和监控智能体的执行流程。
如果你在本地使用 Phoenix,只需要 PHOENIX_ENDPOINT。对于 Phoenix Cloud 服务,你还需要配置 PHOENIX_API_KEY。
记忆
Youtu-RAG 支持记忆功能,用于在对话中保持上下文:
设置为 true 以启用记忆功能,这允许系统记住之前的交互。
日志
配置应用程序的日志级别:
可用的日志级别:
DEBUG: 用于诊断问题的详细信息INFO: 一般信息消息(推荐用于生产环境)WARNING: 潜在有害情况的警告消息ERROR: 严重问题的错误消息CRITICAL: 非常严重错误的关键消息
