颠覆传统生成方式！Adaptive RAG：实时学习、智能调整的下一代检索增强技术

文摘 2024-10-20 07:40 北京

自适应 RAG 是一种结合查询分析与自我纠正机制的检索增强生成技术。它通过智能分析用户的查询需求和查询复杂度，动态调整检索和生成策略，提供更为精准和高效的响应。这种方法不仅提升了生成的准确性，还增强了系统的灵活性，使其能够适应多变的数据环境和用户需求。

论文地址：https://arxiv.org/pdf/2403.14403

论文项目源码：https://github.com/starsuzi/Adaptive-RAG

在查询分析过程中，自适应 RAG 使用一个轻量级的大型语言模型（LLM）分类器来评估查询的复杂性。这种分类器可以判断查询是简单的事实性问题、需要更深入的推理，还是涉及广泛的知识领域。基于对复杂度的判断，自适应 RAG 能够灵活选择不同的检索策略，从而提高生成效率。

例如，对于简单且直接的查询，系统可能选择跳过检索步骤，直接生成答案；对于中等复杂度的查询，采用Single-shot RAG策略，通过一次检索就能获取足够的文档来支持生成；而对于高复杂度的查询，则使用Iterative RAG策略，通过多轮检索逐步细化答案，确保覆盖所有相关的信息。

其架构图如下：

①　单步方法（Single-Step Approach）

简单查询：例如“迈克尔·菲尔普斯的生日是什么时候？”，系统会直接检索相关文档，并生成答案。这种方法在处理简单查询时通常能够准确回答。

复杂查询：例如“比利·吉列斯的出生地使用什么货币？”，在处理复杂查询时，由于仅进行一次检索，结果往往不够准确。

②　多步方法（Multi-Step Approach）

简单查询：尽管像“迈克尔·菲尔普斯的生日是什么时候？”这样简单的查询，系统仍会进行多轮检索和推理，最终生成答案。这导致了不必要的计算开销，使得过程显得低效。

复杂查询：对于复杂的问题，如“比利·吉列斯的出生地使用什么货币？”，系统会进行多轮检索和推理，逐步生成中间答案。这种方法有助于提高复杂查询的准确性。

③　自适应方法（Our Adaptive Approach）

查询分类：引入了一个分类器，用于根据查询的复杂度选择合适的处理方式。

直接查询：例如“巴黎是哪个国家的首都？”，分类器判断为直接回答问题，系统可直接生成答案。

简单查询：例如“迈克尔·菲尔普斯的生日是什么时候？”，分类器判断为简单查询，系统进行单次检索，并生成答案。

复杂查询：例如“比利·吉列斯的出生地使用什么货币？”，分类器判断为复杂问题，系统进行多轮检索和推理，最终生成答案。

自我纠正机制是自适应 RAG 的另一个核心特性。在生成过程中，系统会根据文档的相关性和生成的初步结果进行自我评估。如果发现生成的答案存在不准确或不充分的情况，系统会主动调整检索策略，可能通过重新查询或者扩展检索范围来获取更多支持性的文档。这种循环式的自我调整不仅提高了最终答案的可靠性，还能够适应数据动态变化的情况。

在应用场景上，自适应 RAG 适用于需要高精度和灵活性的任务，如医疗诊断、法律分析和市场研究等。这些领域通常包含大量的复杂文档和不确定的信息来源，自适应 RAG 能够在这些场景中动态调整检索和生成策略，从而提供准确且上下文相关的回答。

此外，自适应 RAG 也适用于需要处理实时数据变化的情况，如新闻报道和社会舆情监测，因为其动态调整机制可以帮助模型更好地应对新信息的出现。

LangChain项目核心代码介绍：

from langchain.schema import Document

def retrieve(state):    """    Retrieve documents
    Args:        state (dict): The current graph state
    Returns:        state (dict): New key added to state, documents, that contains retrieved documents    """    print("---RETRIEVE---")    question = state["question"]
    # Retrieval    documents = retriever.invoke(question)    return {"documents": documents, "question": question}

def llm_fallback(state):    """    Generate answer using the LLM w/o vectorstore
    Args:        state (dict): The current graph state
    Returns:        state (dict): New key added to state, generation, that contains LLM generation    """    print("---LLM Fallback---")    question = state["question"]    generation = llm_chain.invoke({"question": question})    return {"question": question, "generation": generation}

def generate(state):    """    Generate answer using the vectorstore
    Args:        state (dict): The current graph state
    Returns:        state (dict): New key added to state, generation, that contains LLM generation    """    print("---GENERATE---")    question = state["question"]    documents = state["documents"]    if not isinstance(documents, list):        documents = [documents]
    # RAG generation    generation = rag_chain.invoke({"documents": documents, "question": question})    return {"documents": documents, "question": question, "generation": generation}

def grade_documents(state):    """    Determines whether the retrieved documents are relevant to the question.
    Args:        state (dict): The current graph state
    Returns:        state (dict): Updates documents key with only filtered relevant documents    """
    print("---CHECK DOCUMENT RELEVANCE TO QUESTION---")    question = state["question"]    documents = state["documents"]
    # Score each doc    filtered_docs = []    for d in documents:        score = retrieval_grader.invoke(            {"question": question, "document": d.page_content}        )        grade = score.binary_score        if grade == "yes":            print("---GRADE: DOCUMENT RELEVANT---")            filtered_docs.append(d)        else:            print("---GRADE: DOCUMENT NOT RELEVANT---")            continue    return {"documents": filtered_docs, "question": question}

def web_search(state):    """    Web search based on the re-phrased question.
    Args:        state (dict): The current graph state
    Returns:        state (dict): Updates documents key with appended web results    """
    print("---WEB SEARCH---")    question = state["question"]
    # Web search    docs = web_search_tool.invoke({"query": question})    web_results = "\n".join([d["content"] for d in docs])    web_results = Document(page_content=web_results)
    return {"documents": web_results, "question": question}

### Edges ###

def route_question(state):    """    Route question to web search or RAG.
    Args:        state (dict): The current graph state
    Returns:        str: Next node to call    """
    print("---ROUTE QUESTION---")    question = state["question"]    source = question_router.invoke({"question": question})
    # Fallback to LLM or raise error if no decision    if "tool_calls" not in source.additional_kwargs:        print("---ROUTE QUESTION TO LLM---")        return "llm_fallback"    if len(source.additional_kwargs["tool_calls"]) == 0:        raise "Router could not decide source"
    # Choose datasource    datasource = source.additional_kwargs["tool_calls"][0]["function"]["name"]    if datasource == "web_search":        print("---ROUTE QUESTION TO WEB SEARCH---")        return "web_search"    elif datasource == "vectorstore":        print("---ROUTE QUESTION TO RAG---")        return "vectorstore"    else:        print("---ROUTE QUESTION TO LLM---")        return "vectorstore"

def decide_to_generate(state):    """    Determines whether to generate an answer, or re-generate a question.
    Args:        state (dict): The current graph state
    Returns:        str: Binary decision for next node to call    """
    print("---ASSESS GRADED DOCUMENTS---")    state["question"]    filtered_documents = state["documents"]
    if not filtered_documents:        # All documents have been filtered check_relevance        # We will re-generate a new query        print("---DECISION: ALL DOCUMENTS ARE NOT RELEVANT TO QUESTION, WEB SEARCH---")        return "web_search"    else:        # We have relevant documents, so generate answer        print("---DECISION: GENERATE---")        return "generate"

def grade_generation_v_documents_and_question(state):    """    Determines whether the generation is grounded in the document and answers question.
    Args:        state (dict): The current graph state
    Returns:        str: Decision for next node to call    """
    print("---CHECK HALLUCINATIONS---")    question = state["question"]    documents = state["documents"]    generation = state["generation"]
    score = hallucination_grader.invoke(        {"documents": documents, "generation": generation}    )    grade = score.binary_score
    # Check hallucination    if grade == "yes":        print("---DECISION: GENERATION IS GROUNDED IN DOCUMENTS---")        # Check question-answering        print("---GRADE GENERATION vs QUESTION---")        score = answer_grader.invoke({"question": question, "generation": generation})        grade = score.binary_score        if grade == "yes":            print("---DECISION: GENERATION ADDRESSES QUESTION---")            return "useful"        else:            print("---DECISION: GENERATION DOES NOT ADDRESS QUESTION---")            return "not useful"    else:        pprint("---DECISION: GENERATION IS NOT GROUNDED IN DOCUMENTS, RE-TRY---")        return "not supported"

参考项目：https://github.com/langchain-ai/langgraph/blob/main/examples/rag/langgraph_adaptive_rag_cohere.ipynb

http://mp.weixin.qq.com/s?__biz=MzA4NzA4NjAxOA==&mid=2452971629&idx=1&sn=e6d350fea17f31b6f2596f6f17b8f587

AI技术研习社

专注分享人工智能、大模型、算法、大数据开发、数据分析领域的技术干货和落地实践！

最新文章

检索增强生成（RAG）：解密AI如何融合记忆与搜索

揭秘汽车语音助手：从语音识别到智能回复的全流程解析！

RAG 和 RAU：自然语言处理中检索增强语言模型的调查

RAG 驱动的 NER：构建自定义模型的入门指南

基于BERT的对话意图和槽位联合识别模块

GLM-4-Plus上线：杀进“世界前三”，它真的好用吗？

揭秘RAG背后的人机对话流程：从语音识别到智能生成

揭秘RAG：全方位解析RAG检索中的意图识别，如何助力智能问答

Agent智能大揭秘：企业如何利用AI代理驱动高效增长！

LLMs+SQL：用自然语言轻松搞定数据查询，彻底解锁数据库潜能！

秒懂LLM流式输出的SSE原理！一文带你搞定SSE实现和Python实战案例

RAG实战：打造可扩展的智能文档系统：终极 RAG 管道全解析

RAG工具：FlashRAG用于高效 RAG 研究的 Python 工具包

重磅上线！ChatGPT引入Search功能，秒查秒懂新体验！

RAG评估：RAGChecker重磅发布！精准诊断RAG系统的全新细粒度框架！

RAGFlow重磅开源！基于深度文档理解的智能检索神器！

从零开始，用万行代码打造专属向量数据库！

揭秘RAG神器！如何通过上下文检索与混合搜索打造超强生成效果

IM-RAG：解锁AI内心独白，多轮检索增强生成新突破！

Agent实战：基于大模型的Agent技术框架开发实战

重磅发布！Claude 3.5 Sonnet上线，首个能像人类操作电脑的AI，官方提示词全解密！

多模态RAG-ColPali：使用视觉语言模型实现高效的文档检索

LightRAG：创新双级检索系统，整合图形结构，实现更强大信息检索！

颠覆传统生成方式！Adaptive RAG：实时学习、智能调整的下一代检索增强技术

颠覆传统RAG！Corrective-RAG引入自我反思与自我评估，让文档检索更智能更精准！

国内首部以“生成式人工智能”为应用背景的知识产权标准，诚邀参编！

揭秘Self-RAG：引领大型语言模型生成质量的新潮流！

初识 OpenAI 的 Swarm：轻量级、多智能体系统的探索利器

MemoRAG重磅登场：彻底革新AI问答的长期记忆功能！

颠覆RAG性能！揭秘多头RAG的强大优化秘诀

解锁RAG架构：必知的6种提升AI内容生成的检索增强技术（二）

解锁RAG架构：必知的6种提升AI内容生成的检索增强技术（一）

可控 Text2Image：打造您想要的完美图像生成神器

揭秘RAG多模态应用：Text2Image检索开源项目

揭秘顶级 RAG 技术，不可错过的关键知识！

重磅上线！大模型面试题库，助你轻松拿Offer！

零基础快速构建你的LLM Agent框架，掌握AI的未来！

大模型技术揭秘：普通开发者如何轻松快速掌握原理与架构

如何精准计算：大型语言模型（LLM）部署到底需要多少GPU内存？

大模型时代：AI引领企业创新升级的全面爆发

中国金融大模型产业全揭秘：从技术到应用的深度解析

揭秘RAG中的幻觉检测：多种方法全面基准测试，找出最优解！

Autogen快速上手指南：解锁Multi-Agent协作的高效工作流程

揭秘Agent框架：如何打造智能高效的AI应用核心

RAG深度优化：全面掌握多种ReRanker实现方法与技巧

RAG优化神器：rerankers重新排名模型的终极方案，提供轻量级统一API

ChatGPT-5没等到，o1-preview 和 o1-mini强势登场，揭晓它们的独家优势！

大模型时代：解锁自媒体爆款内容运营的秘密武器！

用ClickHouse实现极速向量搜索，性能爆炸提升的秘密！

大模型微调： SFT 经验分享

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉