如何为AI智能体添加RAG以实现上下文理解

文摘科技 2025-01-04 00:00 山东

将RAG功能与其他代理功能（例如角色扮演）相结合，可以创建一个强大的企业级AI代理框架。

译自How To Add RAG to AI Agents for Contextual Understanding，作者 Janakiram MSV。

更多关于人工智能代理开发的系列内容（从GitHub下载所有代码）：

概述：AI 智能体：面向开发人员的全面介绍
步骤 1：如何通过调整 LLM 提示来定义 AI 智能体角色
步骤 2：增强 AI 智能体：添加指令、任务和内存
步骤 3：增强 AI 智能体：通过提示工程实现推理
步骤 4：如何为 AI 智能体添加持久性和长期记忆
步骤 5：如何为 AI 智能体添加 RAG 以实现上下文理解

在我们关于构建企业级 AI 智能体的系列文章中，我们已经探讨了各种关键组件——包括角色、指令、任务、会话记忆和持久性（参见上面的链接）。这些基础知识已经阐明了智能体如何保持其身份、遵循指南、执行任务以及跨会话保持其状态。

现在，让我们深入探讨另一种关键能力，它将智能体提升到真正的企业就绪水平：检索增强生成(RAG) 和上下文管理。

企业智能体对上下文的需要

企业环境中充斥着特定领域的知识、专有信息和标准语言模型无法访问的专业文档。虽然我们之前的实现使智能体能够维护会话历史并保持其状态，但它们仍然缺乏将响应建立在组织特定知识基础上的能力。当智能体需要处理有关内部流程、产品或策略（这些不在其训练数据中）的查询时，这种限制尤其明显。

通过 RAG 进行上下文管理解决了这一关键差距，它允许智能体动态地访问和整合组织文档库中的相关信息到其响应中。此功能将智能体从通用助手转变为能够提供准确、上下文感知的响应并同时遵守组织准则的专用企业工具。

实现上下文管理

上下文管理系统使用向量数据库（在本例中为 ChromaDB）来实现高效的相似性搜索和检索。以下是我们上下文管理实现的核心结构：

classContextManager:      def__init__(self, collection_name: str, persist_dir: str="context_db", chunk_size: int=1000, chunk_overlap: int=200):          self.persist_dir=persist_dirself.collection_name=collection_nameself.chunk_size=chunk_sizeself.chunk_overlap=chunk_overlap# Initialize ChromaDB self.client=chromadb.PersistentClient(path=persist_dir)          self.collection=self.client.get_or_create_collection(             name=collection_name, metadata={"hnsw:space": "cosine"}         )

此实现提供了几个关键功能：

1. 文档处理和索引

上下文管理器实现了复杂的文档处理功能，这些功能可为高效检索准备组织内容。文档通过包括文本提取、分块和嵌入生成的管道进行处理。分块策略尤其重要，因为它决定了文档如何被分割成可管理的片段，同时保持语义连贯性：

defindex_document(self,                     pdf_path: str,                     metadata: Optional[Union[Dict[str, Any], DocumentMetadata]] =None) -&gt; bool:     """    Index a PDF document into the vector store.    """try:         # Convert metadata to DocumentMetadata if it's a dictifisinstance(metadata, dict):             metadata=DocumentMetadata.from_dict(metadata)         elifmetadataisNone:             metadata=DocumentMetadata(source=os.path.basename(pdf_path))                  # Extract text from PDFtext=self._extract_text_from_pdf(pdf_path)                  # Split text into chunkschunks=self._text_splitter.split_text(text)                  # Generate unique IDs and prepare metadataids= [self._generate_document_id(chunk, metadata.to_dict()) forchunkinchunks]         metadatas= [metadata.to_dict() for_inchunks]                  # Add to ChromaDBself.collection.add(             documents=chunks,             ids=ids,             metadatas=metadatas         )                  returnTrueexceptExceptionase:         logger.error(f"Error indexing document {pdf_path}: {str(e)}")         returnFalse

2. 上下文检索与整合

该系统实现了智能上下文检索，超越了简单的关键词匹配。当代理需要回应查询时，上下文管理器会根据语义相似性检索最相关的文档片段。

defquery(self,           query: str,           num_results: int=3,          filter_metadata: Optional[Dict[str, Any]] =None) -&gt; str:     """    Query the context and return relevant information.    """try:         self._current_query=query# Prepare query parametersquery_params= {             "query_texts": [query],             "n_results": num_results         }         iffilter_metadata:             query_params["where"] =filter_metadata# Execute queryresults=self.collection.query(**query_params)                  # Format the context with metadatacontext_parts= []         fori, (doc, metadata) inenumerate(zip(             results['documents'][0],              results['metadatas'][0]         ), 1):             source=metadata.get('source', 'Unknown source')             context_parts.append(                 f"Relevant Context {i} (from {source}):\n{doc}\n"             )                  self._current_context="\n".join(context_parts)         returnself._current_contextexceptExceptionase:         logger.error(f"Error executing query: {str(e)}")         self._current_context=""return""

3. 与代理架构集成

上下文管理系统与我们现有的代理架构无缝集成。代理类得到了增强，以包含上下文感知功能：

# 1. Initialize context and index the PDFprint("\nStep 1: Initializing context and indexing document...") context=ContextManager.initialize(     collection_name="simple_docs",     persist_dir="context_db" )   pdf_path="quantum_computing.pdf"metadata=DocumentMetadata(     source=os.path.basename(pdf_path),     doc_type="pdf",     author="Demo Author",     created_at=datetime.now(),     tags="technical,quantum,computing" )   success=context.index_document(pdf_path, metadata)   # 2. Create and configure the agent with contextprint("\nStep 2: Creating agent with context...") agent=Agent("rag_agent", context=context)   # Set agent persona and instructionagent.persona="""I am a helpful AI assistant that provides accurate information based on the given context. I analyze documents and explain complex topics in a clear and understandable way."""agent.instruction="""When explaining concepts from the document:1. Focus on key principles and fundamentals2. Use clear and precise language3. Provide relevant examples where applicable"""# 3. Query and get response using contextprint("\nStep 3: Setting context and executing task...") context_query="What are the main principles of quantum computing?"agent.set_context_query(context_query)   agent.task="""Based on the provided context:1. Identify and explain the key principles of quantum computing"""response=agent.execute()

这种实现展示了上下文是如何无缝集成到代理的工作流程中的。代理首先摄取并索引文档，然后使用这些上下文来将其响应基于所提供的特定知识库。上下文与代理的角色和指令相结合，确保了响应既准确又符合组织要求。

增强型RAG代理的企业优势

RAG能力的提升将我们的代理转变为企业级解决方案，提供三个关键优势：

1. 知识基础

增强RAG功能的代理可以将其响应建立在组织特定的知识基础上，确保准确性和相关性。对于企业环境而言，此功能至关重要，因为响应必须符合内部策略、程序和特定领域的知识。系统维护文档元数据和版本控制，从而能够追溯信息来源并支持合规性要求。

2. 动态信息更新

上下文管理系统支持对知识库进行动态更新。可以对新文档进行索引并立即提供给代理，确保它们始终使用最新信息。此功能在策略、产品或程序频繁变化的环境中尤其宝贵。

3. 合规性和审计支持

通过维护响应和源文档之间的清晰链接，系统支持合规性要求并能够对代理响应进行审计。元数据系统跟踪文档来源、版本和使用情况，为审计目的提供清晰的线索。这种透明度对于需要记录决策来源的受监管行业至关重要。

RAG实施最佳实践

在代理系统中实施RAG功能时，需要考虑以下几个关键因素：

1. 文档处理

有效的文档处理对于RAG的成功至关重要。分块策略应在粒度和上下文保留之间取得平衡，确保检索到的块包含足够的上下文，同时保持重点。元数据管理应全面，捕获所有可能需要用于过滤或审计的相关文档属性。系统应处理各种文档格式和结构，在整个处理流程中保持语义一致性。

2. 上下文检索

检索系统应针对相关性和性能进行优化。应仔细调整相似度阈值，以平衡精度和召回率，确保检索到的上下文既相关又全面。系统应实施高效的缓存策略以优化对频繁访问内容的性能。查询处理应同时考虑语义相似性和元数据过滤器，从而实现精确的上下文检索。

3. 集成策略

与现有代理功能的集成应无缝且高效。上下文系统应与代理的角色、指令、任务执行和推理能力和谐地协同工作。状态管理应包含与上下文相关的信息，从而能够在会话之间保持持续的上下文感知。系统应提供清晰的上下文更新和维护接口。

未来展望

随着企业AI的不断发展，RAG和上下文管理的作用将变得越来越重要。未来的增强功能可能包括更复杂的文档理解能力、改进的上下文相关性排名和高级元数据管理系统。与企业知识图谱的集成可以提供额外的上下文结构，而改进的分块策略可以更好地保留文档语义。

RAG功能与我们之前实施的功能（角色、指令、任务、会话记忆和持久性）相结合，为企业级AI代理创建了一个强大的框架。这些代理现在可以维护其身份、遵循指南、执行任务、持久化其状态，并将它们的响应建立在组织特定的知识基础上，使它们成为企业自动化和辅助的强大工具。

在本系列的最后一部分，我们将添加代理最重要的构建块：一个工具。敬请期待。

云云众生s

关注云原生时代的普通人 - 云原生 | 平台工程 | AI

最新文章

开源硬件年度回顾：Car Things和OpenWrt One

展望2025年WebAssembly的应用

2025年云服务趋势：行业专用和无服务器

2025年，道德和可解释AI是创业的当务之急

没有真实反馈的速度毫无意义

DEVOPS与安全：如何构建弹性流水线

工程师必须成为敏捷协作忍者

您的内部开发者平台缺少编排功能吗？

2025年开发者生产力：更多AI，但结果喜忧参半

2025年AI的四个预测：自主式AI为何注定失败

各行各业如何利用AI代理将数据转化为决策

如何为AI智能体添加RAG以实现上下文理解

2025年的EBPF：比CROWDSTRIKE宕机事件影响更大

P99CONF：EBPF如何构建更快的数据库系统

FALCO如何为基础设施带来实时可观测性

用于生成式AI的OPENTELEMETRY

2024年开发者工作方式的数据告诉了我们什么

2025年的开源：系好安全带，颠覆就在眼前

重新授权的开源项目及其分叉会发生什么？

2024年的基础设施即代码：为什么它仍然如此糟糕

2025新年随想

2025年的可观测性：OpenTelemetry和AI填补空白

开源预测：RUST将爆发，SBOM将成为哑弹

AI、硬件和开放模型：朝着Linux方向发展

编程语言大战2024：PYTHON领跑，JAVA保持稳定，RUST崛起

开发者工具：2025年的展望

2024年度JAVASCRIPT回顾：热点新闻

RUST 2024重大时刻

从IAC到云管理：PULUMI的演变历程

PULUMI模式与实践平台 (P3)：面向大型组织的参考架构

X的巨型计算机改变了SC500性能游戏

美国联邦政府：关键软件必须在2026年前放弃C/C++，否则将面临风险

您的微服务集成测试为何错过实际问题

促进学习回顾成功的四种方法

基于量子启发的软件压缩大语言模型

平台工程师为何拥抱用于无服务器的WebAssembly

运通的FAAS使用WEBASSEMBLY而非容器

联邦政府推动WebAssembly提升云原生安全

WEBASSEMBLY不会很快取代DOCKER

KUBERNETES架构师的10条技巧：献给K8S十周年

基于Kubernetes优先的方法扩展数据平台

在KUBERNETES上安全地部署和运行多个租户

云原生多集群用户界面，适用于Cloud Foundry和Kubernetes

开源世界的年度盘点：Kubernetes、Rust、Linux和DOS？

2024年WEB开发趋势：回归简洁

2024年顶级开发者工具和WEB开发者趋势

初创企业如何通过无边界数据战略蓬勃发展

招聘JavaScript开发人员？使用这些面试技巧

2025年可能影响前端开发人员的网站托管趋势

Vercel、Netlify和Fastly等开发者平台如何使用AI

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉