利用元数据过滤、Hybrid Search、 Agent 等功能提升您的 RAG 应用

文摘 2024-08-26 18:30 中国香港

什么是 RAG？

检索增强生成（Retrieval Augmented Generation，简称 RAG）是一种通过整合外部数据源来增强大语言模型（LLM）的技术。典型的 RAG 应用包含以下几个步骤：

索引流程：从数据源获取数据并创建索引。这个流程通常包括在 Milvus 中加载数据、切分数据，以及对数据进行排序。

检索和生成：在运行时，RAG 应用处理用户的查询，从存储在 Milvus 中的索引中获取相关数据形成上下文，然后 LLM 基于丰富的上下文生成响应。

有多种方法可以改进 RAG 应用。本文将介绍如何利用 Milvus 向量数据库的元数据过滤、Hybrid Search 和 Agent 功能来提升 RAG 应用的性能。

元数据过滤

在将数据插入 Milvus 时，建议同时包含元数据。例如，如果您需要在 Milvus 中插入 PDF 文件的向量，您可以同时插入页码、PDF 文件名、作者等元数据信息。

通过在 Milvus 中存储元数据，您可以在搜索时过滤掉不相关的数据，从而提升检索的速度和效率。元数据过滤特别适合 RAG 应用，因为您可以确保只将与用户查询相关的内容传入 LLM。

Milvus 支持 full-string 元数据匹配，系统会通过 prefix、infix、postfix，甚至字符通配符（wildcard）搜索来匹配字符串。


    # Prefix example, matches any string starting with “The”.    expression='title like "The%"'    # Infix example, matches any string with the word “the” anywhere in the sentence.    expression='title like "%the%"'    # Postfix example, matches any string ending with “Rye”.    expression='title like "%Rye"'    # Single character wildcard example, matches any one single character at a specific position.    expression='title like "Flip_ed"'

同样，Milvus 也支持使用数组值进行元数据过滤。通过精确匹配或 contains_any() 检查数组中的是否有匹配的元素。

Hybrid Search

Milvus 单个 Collection 中最多可创建 10 个向量字段。换言之，Milvus 支持多向量查询，用户能够同时在多个向量列中进行搜索。这一功能促进了多模态搜索、稀疏和稠密向量混合搜索，以及密集向量和全文混合搜索，提供了多样化和灵活的搜索能力。

不同列中的向量由不同的 Embedding 模型生成，可以用于从不同方面表示同一条数据。使用Hybrid Search 后，搜索结果会根据各种重排（rerank）策略进行重新排序和整合。

Milvus Hybrid Search 的原理

从多个角度表示信息。例如，在电子商务行业中，产品图片会包含产品的正面、侧面和顶部。不同视角的图片可以用不同类型或维度的向量来表示。

利用各种类型的 Embedding 向量，包括由 BERT 和 Transformers 等模型生成的稠密向量，以及由 BM25、BGE-M3 和 SPLADE 等算法生成的稀疏向量。

支持来自各种非结构化数据类型（如图像、视频、音频和文本文件）的多模态向量。例如，在刑事调查中，可以用指纹、声纹和面部识别等多模态的生物特征来表示嫌疑人。多模态数据有助于跨不同模态识别目标。

支持将向量搜索和全文搜索相结合。

RAG 应用中的 Agent

LLM 无法单独使用，它们只能输出文本。而 Agent 可以通过使用 LLM 作为引擎来确定采取哪些行动以及向 LLM 传入哪些内容。在执行任务后，Agent 可以将结果传回 LLM，从而确定结束任务还是执行更多任务。

Agent 可以用来执行许多任务，如搜索网页、浏览您的电子邮件、纠正 RAG、根据检索文档对 RAG 添加自我反思（Self-reflection）或自我评分（Self-grading）等。

设置完成后，Agent 可以将新的数据添加到 Milvus 中，或检索数据并将其传入您的 LLM。通过使用 Agent，您的 RAG 系统中能够始终整合最新知识。Milvus 还支持通过 upsert() 函数轻松更新数据。

总结

通过使用 Milvus 中的元数据过滤、Hybrid Search 和 Agent 功能，您可以提升您的 RAG 应用性能。

元数据过滤帮助您根据特定信息过滤数据，实现精确和高效的搜索。混合搜索通过允许跨多个向量列进行查询，扩展了搜索能力。Agent 通过基于 LLM 输出自动执行操作来提升 RAG 功能。

Zilliz

Simply The Fastest Vector Database for AI. Period.

最新文章

手把手系列｜一篇文章教会你使用有RAG功能的CAMEL框架

客户案例｜Zilliz Cloud 助力 MindStudio 搭建无代码平台，革新 AI 应用开发方式

使用 Milvus、vLLM 和 Llama 3.1 搭建 RAG 应用

官宣：Zilliz 在亚马逊云科技中国区正式开服！

图像与文本并存，多模态检索如何带来新的搜索革命

聊一聊：你最想用大模型实现的功能是什么

引领非结构数据浪潮， Zilliz再度上榜Cloud 100 China榜单

聊一聊：你遇到最难忘的技术面试（内含福利与岗位内推）

如何评估 Embedding 模型

一文读懂，为什么向量数据库是大模型时代的核心基础设施

合碳智能 × Milvus：探索化学合成新境界——逆合成路线设计

使用 Milvus 和 Streamlit 搭建多模态产品推荐系统

聊一聊：大模型热潮，还会再火多久（内含福利）

Milvus 向量数据库进阶系列丨构建 RAG 多租户/多用户系统 (下）

聊一聊：Runway“删库跑路”，到底为什么（内含福利）

使用 Milvus Lite、Llama3 和 LlamaIndex 搭建 RAG 应用

扩博智能× Milvus：图像检索助力零售商品图像高效标注

向量数据库Milvus源码开发贡献实践

利用元数据过滤、Hybrid Search、 Agent 等功能提升您的 RAG 应用

聊一聊：工作中，你遇到过哪些堪比rm -rf的灾难现场（内含福利！）

使用 Ollama、Llama 3.1 和 Milvus 实现Function Calling 功能

手把手系列｜无需 OpenAI 即可搭建 RAG 应用（二）

Milvus在数派数据大模型业务中的实践

手把手系列｜使用Milvus、Llama 3、Ollama、LangChain本地设置RAG应用

Unstructured Data Meetup 南京场收官！干货指南：大模型、向量数据库和 RAG

直播预告｜从 BM25 到 SPLADE，稀疏向量如何优化 RAG

使用 Hugging Face 和 Milvus 构建 RAG 系统

聊一聊：用这招，一键去班味！（内含福利！）

博世（BOSCH）× Milvus：智能驾驶领域的数据挖掘革新

长文本与RAG——AI应用的双引擎

KubeSphere 部署AI向量数据库 Milvus 实战指南

8月17日，南京Unstructured Data Meetup还能报名！

聊一聊：什么职业绝不会被AI取代？（内含福利！！！）

Dopple Labs 选择 Zilliz Cloud 作为安全高效的向量数据库

聊一聊：为奥运健儿们打call！（内涵福利！）

面向 RAG 应用开发者的实用指南和建议

如何在生成式AI里使用 Ray Data 进行大规模 RAG 应用的 Embedding Inference

Milvus 向量数据库进阶系列丨构建 RAG 多租户/多用户系统 (上）

聊一聊：我在工位用AI...（内涵福利！！！）

对话 Zilliz 创始人 Charles：如何在AGI的浪潮下慢慢地快

聊一聊：这部科幻电影陪我度过了很多个周五（内涵福利！！）

Ivy.ai × Zilliz Cloud：构建 GenAI 驱动的聊天应用

一文剖析高可用向量数据库的本质

探索 Milvus 数据存储系统：如何评估和优化 Milvus 存储性能

Milvus × RAG助力快看漫画多业务应用

Milvus 向量数据库进阶系列丨部署形态选型

云启AI，数领未来｜Zilliz 华北地区高层闭门会圆满结束

Zilliz 推出 Spark Connector：简化非结构化数据处理流程

(内含福利!!) 8月17日，邀您共赴南京Unstructured Data Meetup！

活动回顾｜Unstructured Data Meetup 北京场

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉