检索增强生成(RAG)
索引阶段:索引阶段涉及从各种来源获取数据,包括数据库、API 和文件系统。这些数据经过文件解析和文本分块处理,为分析做准备。处理后,数据被 Embedding 到适当的格式,并加载到向量数据库中,以便有效检索。一些 RAG 系统甚至采用高级数据挖掘技术,如标签提取、知识图谱构建和摘要,以丰富数据并改进检索过程。 服务阶段:在线查询服务阶段专注于理解用户的查询意图,并采用各种检索方法,包括向量相似性搜索,以找到最相关的信息。检索结果随后被发送到 LLM 进行生成。在这一步中,LLM 基于检索到的数据生成连贯且符合上下文的输出。此外,LLM 还可以作为代理,利用外部工具来增强其能力,并提供更全面和准确的响应。
1. 工作流程编排与优化
2. 质量评估与监控
3. 数据 Connector 和网络抓取
4. Embedding 和 Reranker 模型
5. LLM 推理和托管
6. 代理和内存管理
7. 外部工具和代理 API
8. 前端和搜索/聊天用户界面体验
9. 知识图谱(KG)
10. 开箱即用的低代码 RAG 服务
11. 图像和视频生成
创意生成和数字孪生
总结
作者介绍
陈将
Zilliz 生态和 AI 平台负责人