RAG从入门到精通系列2：Query Translation（查询翻译）

文摘 2025-01-17 17:49 安徽

LLM（Large Language Model，大型语言模型）是一个功能强大的新平台，但它们并不总是使用与我们的任务相关的数据或者是最新的数据进行训练。

RAG（Retrieval Augmented Generation，检索增强生成）是一种将 LLM 与外部数据源（例如私有数据或最新数据）连接的通用方法。它允许 LLM 使用外部数据来生成其输出。

要想真正掌握 RAG，我们需要学习下图所示的技术（技巧）：

在《RAG从入门到精通系列1：基础RAG》一文我已经介绍了基础的 RAG 部分：Indexing（索引）、Retrieval（检索）和 Generation（生成）。

在机器学习领域有一句经典的话：Garbage in，Garbage out

这句话也是适合于 RAG，因为我们现在检索的原理就是根据用户的 Query（也就是 Question）的语义去检索相关的文档。

但是我们不能指望所有的用户都能清楚地描述自己的 Query，如果用户写了一句模棱两可的 Query 或者是一个复杂的 Query，那么检索到的文档也将是模棱两可或者难以准确检索，进而导致 LLM 的回答就不准确：

在这篇文章中我将介绍 RAG 的高阶技巧：Query Translation（查询翻译）：

更具体地，我们将学习 Re-written（改写）、Step-back question（优化问题）和 sub-question（分解问题）这三种 Query Translation 方法，进而提升检索和生成的效果。

Re-written

Re-written 是指对原始查询进行语义重写，保持核心意思不变，但调整语言表述，使得问题更易被知识库或检索系统处理。

我们将原始 Question 改写成三种表述方式 Q1、Q2 和 Q3，然后分别检索与这三种问题相关的文档：

应用场景：

原始问题语言模糊或表述不清。
需要通过不同的表述来优化检索匹配。

示例：

原始问题：“Python 的用法？”
Re-written：“Python 编程语言的常见使用场景是什么？”
效果：改写后的问题更具体，更容易检索到高质量答案。

常见方法：

Multi-Query：在检索阶段针对同一个问题生成多个不同的查询，通过这些查询去检索知识库，以获得更全面或相关的文档集合。
RAG Fusion：一种在生成阶段融合检索结果的策略。它关注的是如何从多个检索到的文档中综合信息，以生成高质量的回答。

优点：

增强了检索系统对问题的理解能力。
提高了检索结果的相关性。

挑战：

如何保持改写问题与原始问题的语义一致性。
避免引入偏差或歧义。

1. Multi-Query

首先我们准备一个 Prompt，让 LLM 将原始问题转写成 5 个不同表述方式的问题：

接下来就是分别检索与这 5 个问题相关的文档，并把这些文档去重之后组织在一起：

最后我们将上述拆分问题的链和检索链串起来形成最终的 RAG 管道，我们还引入了新的 Prompt：

2. RAG Fusion

这个过程与 Multi-Query 很相似，但是对检索到的多篇文档进行筛选过滤之后再输入 LLM：

我们先写一个 Prompt：根据原始问题生成 4 个相关的问题：

这里我将实现一个简单的 Reciprocal Rank Fusion (RRF) 检索过滤方法：

最终的 RAG 管道：

Decomposition

也就是 sub-question，是将复杂的问题拆解为多个独立的子问题，每个子问题可以单独处理。最终通过聚合子问题的答案来生成完整的回答。

应用场景：

多跳问题（需要跨多个知识点回答）。
包含逻辑操作或条件限制的问题。

示例：

原始问题：“诺贝尔奖得主中，谁既是科学家又是文学家？”
Sub-question：

“诺贝尔奖得主中有哪些科学家？”
“诺贝尔奖得主中有哪些文学家？”
“有哪些人既是科学家又是文学家？”

效果：通过独立回答每个子问题，最终整合得到准确的答案。

方法：

逻辑分解：基于问题中的逻辑关系（如“且”、“或”）。
多跳分解：根据问题需要跨越的知识领域，逐步深入。

优点：

减少了问题的复杂性，提高了检索和生成的准确率。
提供了更清晰的推理过程，便于调试和分析。

挑战：

分解的子问题可能存在相互依赖关系，需要设计合理的顺序。
子问题答案的整合可能存在冲突或不一致。

Sub-question 流程一

类似于“递归求解”：用前一个子问题答案结合下一个子问题检索到的文档来生成下一个子问题的答案。

首先，设定 Prompt：

然后就是完整的 RAG 管道：

Sub-question 流程二

先得到每个子问题的答案，然后集中汇总得到最终答案。

分别获得每个子问题的答案：

汇总答案：

Step-back Question

在检索和回答过程中，当系统意识到当前的问题太具体或难以直接回答时，退一步改问一个更广泛、更概括性的问题，从而获取更大的上下文信息。

应用场景：

当前查询太具体，无法直接匹配知识库内容。
检索结果中没有足够的信息来回答原始问题。

示例：

原始问题：“爱因斯坦在 1921 年诺贝尔奖颁奖仪式上的具体演讲内容是什么？”
Step-back Question：“爱因斯坦为什么获得 1921 年诺贝尔奖？”
效果：通过回答更概括的问题，间接获取相关的上下文信息，为后续回答具体问题提供支持。

优点：

提高了检索的召回率和上下文覆盖率。
适用于数据稀疏或回答难度较高的场景。

挑战：

如何自动判断何时需要“退一步”？
退回的问题是否仍能与原始问题保持语义相关性。

我们首先需要提供 few-shot example 给 LLM，使 LLM 知道如何修改原始问题：

效果如下：

完整的 RAG 管道：

HyDE

HyDE（Hypothetical Document Embedding）是一种用于 Query Translation 的创新方法，特别适用于 RAG 系统中的复杂问题处理。HyDE 的核心思想是通过生成“假设文档”（Hypothetical Document），将查询从抽象的自然语言问题转化为检索系统能够高效处理的表示。

以下是 HyDE 的典型流程：

输入问题：用户输入一个自然语言问题，如：

“哪个国家首次成功发射了人造卫星？”

生成假设文档：

“第一个成功发射人造卫星的国家是苏联，他们在 1957 年发射了 Sputnik 1。”

使用语言模型（如 GPT）生成一个可能的回答，假设内容可能是：
这一步提供了一个强语义上下文的假设答案，即使生成的假设答案可能并不完全正确。

检索相关文档：

将生成的假设文档嵌入向量空间或提取关键词，作为检索系统的输入，搜索知识库中与其最相关的文档。

生成最终答案：

将检索到的文档和原始问题结合，通过生成模型生成最终的回答。

HyDE 的做法是：

生成假设文档：使用生成模型（如 GPT）对输入问题生成一个假设答案，作为问题可能的语义扩展。
检索相关文档：将生成的假设文档作为输入，通过嵌入匹配或关键词匹配的方式，检索知识库中的相关文档。
整合检索结果：结合原始查询和检索到的相关文档，生成最终的回答。

Prompt 的威力

不管是 Re-written、Decomposition 还是 Step-back Question，这些都借助了强大的 Prompt。

也许你的英文不太好，而我们的资料库又都是英文，所以我可以建一个翻译 Chain：将用户的中文问题先翻译成英文。

然后再要求 LLM 用中文回答问题：

GitHub 链接：

https://github.com/realyinchen/RAG/blob/main/02_Query_Translation.ipynb

文章来源：PyTorch研习社

PyTorch研习社

打破知识壁垒，做一名知识的传播者

最新文章

结合Neo4j与Milvus的图谱与向量搜索构建GraphRAG Agent

OpenAI o3-mini 干翻了 DeepSeek R1？

探索提升RAG系统问答质量的技术路线

微软CoRAG：提升多步骤问答任务的表现

5种LLM微调策略：动态图示清晰解析

RAG从入门到精通系列6：Retrieval（检索）

深度解析DeepSeek-R1——打造推理型大模型的配方

Model2Vec加速RAG：模型小15倍，速度快500倍：

RAG从入门到精通系列5：Indexing（索引）

RAG从入门到精通系列4：Query Construction（查询构造）

RAG中的5种文档切分策略：动态图示清晰解析

OpenAI发布的Operator是什么？

AI制裁无效！DeepSeek-R1、DeepSeek-V3和GRPO论文总结

Kimi k1.5：与全功率o1性能匹敌的LLM技术分析

DeepSeek-R1发布24小时后，AI行业反应怎么样？

DeepSeek-R1：一款革命性的国产开源推理LLM，挑战OpenAI的高性能模型

Medium上20万次阅读的思维链高级提示付费文章

RAG从入门到精通系列3：Routing（路由）

Agentic RAG实战：LangChain+LangGraph+Docling+ChromaDB

GitHub上41.3k颗星的2025年最新免费LLM课程

传统 RAG vs. Agentic RAG：动态图示清晰解析

吴恩达：AI产品管理的黄金时代已来，未来属于懂技术的PM！

RAG从入门到精通系列2：Query Translation（查询翻译）

OpenAI率先突围：AI自我进化

RAG从入门到精通系列1：基础RAG

LLM应用落地：购买GPU的最佳指南

用LangChain的LLM Graph Transformer解锁构建知识图谱构的新姿势

2025年这7种用于构建Agentic RAG系统的架构不可或缺

CAG能取代RAG吗？别被表面现象迷惑！

增强版o1模型：Search-o1=Agentic搜索+文档内推理机制

8000字文章的AI Agent全解析：工具、规划与失败模式的深度探索

传统的SaaS的将在2025 Agent时代走向终结

NVIDIA CES2025 大会凭什么震撼了整个 AI 领域？

2025如何学习Agent？谷歌重磅发布Agent白皮书

探索AI Agent工作流设计模式：构建智能任务协作的未来

微调提升LLM准确性，SQL查询任务实现从0%到90%准确率的突破！

用基于Qwen-2.5-7B的Code Agent打造本地、开源的Multi-Agent RAG系统

大模型不一定是最优解！小模型更适合企业？

四种腾讯最新的QO技术提高RAG系统的效率和准确性：扩展、分解、消歧、抽象

Graph RAG实战：使用知识图谱和AI检索、筛选和总结医学期刊文章

AGI前夜的思考：从o3到AGI，未来已来（前端可能没未来了）

2025 Agent之年：Anthropic万字文章披露如何构建高效的AI Agent系统

从创意到工作效率，谷歌为你整理了321个生成式AI在多个行业的变革性应用

万万没想到，一家中国量化基金公司年底发布了最强开源LLM：DeepSeek V3

2025年值得入坑AI Agent的五大框架

GPT之父从OpenAI离职！OpenAI“众叛亲离”对AI的发展或许是一件好事

ModernBERT在LLM时代重塑BERT的速度与效能

12天12大突破！OpenAI的创新狂潮，彻底改变未来科技

用 PydanticAI 构建智能体应用：评估驱动开发的新时代

HuggingChat：开源、自由、高效的生成式对话平台

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉