Milvus×Dify半小时轻松构建RAG系统

文摘 2024-10-14 19:58 北京

最近，检索增强生成（RAG）技术在AI界引起了广泛关注。作为一种将知识库与生成模型结合的新型架构，RAG大大提升了AI应用的实际表现。而在构建RAG系统时，Milvus作为业界领先的开源向量数据库，扮演着关键角色。本文将通过在Dify平台上使用Milvus，带领大家构建一个高效的RAG系统，探索向量数据库的实际应用场景。

01.

Milvus基本原理介绍

1.1 为什么要用向量数据库？

在AI应用场景下，比如图像识别、自然语言处理等，数据往往是非结构化的。传统的关系型数据库很难处理这些高维度的非结构化数据。因此，向量数据库应运而生，专门设计用于存储和管理这种数据，并可以实现高效的相似度检索。

向量数据库通过将复杂的数据（如图片、文本）转化为向量的形式进行存储，每个向量代表数据中的不同特征，方便快速检索相似内容。比如在推荐系统中，可以通过用户行为向量，检索出相似用户的行为进行个性化推荐。

1.2 为什么要用Milvus？

Milvus 是目前领先的开源向量数据库之一，设计之初就针对大规模非结构化数据的存储与检索进行了优化。它具备如下优势：

高性能：Milvus基于诸如FAISS、Annoy和HNSW等先进的向量搜索库，能够处理亿级甚至更大规模的向量数据，适合需要高效检索的应用场景。

可扩展性：Milvus采用了存储和计算分离的架构，支持水平扩展，能够灵活适应从小型应用到大型分布式系统的需求。

广泛的应用场景：Milvus可以应用于各种AI场景，如图像、视频检索，文本检索，推荐系统等，具有广泛的行业适用性

通过使用Milvus，我们能够大大提升在大规模向量检索场景下的处理效率，从而让AI应用变得更加智能、高效。

1.3 Milvus架构概述

Milvus 建立在流行的矢量搜索库（包括 Faiss、HNSW、DiskANN、SCANN 等）之上，旨在对包含数百万、数十亿甚至数万亿矢量的密集矢量数据集进行相似性搜索。

Milvus 采用共享存储架构，存储和计算分离，计算节点可水平扩展。Milvus 遵循数据平面和控制平面分解的原则，包括：接入层、协调器服务、工作节点和存储。在扩展或灾难恢复方面，这些层是相互独立的。

1.4 Milvus 的应用场景

Milvus 的应用场景非常广泛，包括但不限于：

图像和视频检索。我们可以使用 Milvus 存储图像和视频的向量数据，然后使用这些向量数据进行检索。

文本检索。我们可以使用 Milvus 存储文本的向量数据，然后使用这些向量数据进行检索。

推荐系统。我们可以使用 Milvus 存储用户和物品的向量数据，然后使用这些向量数据进行推荐。

自然语言处理。我们可以使用 Milvus 存储文本的向量数据，然后使用这些向量数据进行自然语言处理。

02.

Dify 平台的介绍

Dify 是一款开源的大语言模型(LLM) 应用开发平台。它融合了后端即服务（Backend as Service）和 LLMOps 的理念，使开发者可以快速搭建生产级的生成式 AI 应用。即使你是非技术人员，也能参与到 AI 应用的定义和数据运营过程中。

03.

Milvus 与 Dify 平台的部署实践

在部署过程中，我发现Milvus提供了三种部署模式，分别适合不同的使用场景。接下来，我会分别介绍这三种模式，并通过简单的示范，带你快速上手。

模式一：Milvus Lite

是一个可以轻松集成到您的应用程序中的 Python 库。作为 Milvus 的轻量级版本，它非常适合在 Jupyter Notebook 中快速原型设计或在资源有限的边缘设备上运行。

3.1.1 设置 Milvus Lite

pip install -U pymilvus

3.1.2 连接Miluvs Lite

在pymilvus中，指定本地文件名作为 MilvusClient 的 uri 参数将使用 Milvus Lite。

运行下面代码后，将在当前文件夹中生成一个名为milvus_demo.db的数据库文件。

from pymilvus import MilvusClient
client = MilvusClient("./milvus_demo.db")

模式二：Milvus Standalone

3.2.1 首先，我们需要获取Milvus的部署文件，只需在终端运行以下命令

wget https://github.com/milvus-io/milvus/releases/download/v2.4.5/milvus-standalone-docker-compose.yml -O docker-compose.yml

3.2.2 然后执行以下命令，Milvus就可以启动啦！

sudo docker compose up -d

3.2.3 等一会儿，就会看到Milvus已经在后台运行

docker ps -a

模式三：Milvus Distributed

如果你的需求是处理大规模数据，比如亿级别的向量检索，那么Milvus Distributed正是为你量身定制。它可以部署在Kubernetes集群中，适合云原生架构的大规模场景。

简单部署示范：

1.配置好Kubernetes集群。

2.使用Helm或Operator进行Milvus的分布式部署。

Milvus在Dify上的实战

说明：请确保系统已安装docker和docker-compose

将dify项目Clone到本地

git clone https://github.com/langgenius/dify.git

拷贝env并修改指定使用Milvus

cp .env.example .env

执行docker-compose启动dify

docker-compose -f docker-compose.yaml up -d

访问dify平台并登录

使用Milvus构建RAG

说明：部署前已准备好模型，此文档中对如何部署本地模型不做赘述

准备数据集创建知识库上传测试文档

验证向量检索是否成功

可以看到dify日志里显示是成功的

Milvus数据库中也有数据了

尝试验证RAG效果

04.

未来展望

想象一下，未来我们可以用Milvus处理数以亿计的图像或文本，并在几秒内完成检索。而且，Milvus不断进化，未来的版本可能在数据安全性、可视化、性能扩展等方面做得更加出色。

作者介绍

Milvus 北辰使者：尹珉

Zilliz

Simply The Fastest Vector Database for AI. Period.

最新文章

手把手系列丨如何使用Milvus Backup备份向量数据

聊一聊：ChatGPT搜索引擎会取代谷歌和百度吗？

一文读懂什么是RAG，如何搭建多模态RAG降低大模型幻觉

AI校园新星直通车再启动：Zilliz助您踏上开源舞台

Milvus 表情包上线啦！加入开源社区，用表情传递热情！

算法打败文盲，我用向量数据库与RAG，做了个“鲁迅没说过”

报名进行中丨11月2日深圳Unstructured Data Meetup

手把手系列丨在Kubernetes部署Milvus开源向量数据库

GenAI 生态系统现状：不止大语言模型和向量数据库

Forrester Wave™ 向量数据库报告：Zilliz 进入领导者象限

年度重磅：「非结构化数据峰会」报名正式启动

如何处理海量数据？基于Milvus向量数据库的高度可扩展性

(内含福利!!)11月2日深圳Unstructured Data Meetup等你来！

智联招聘×Milvus：向量召回技术提升招聘匹配效率

还能报名：向心力｜中美 AI 应用与落地分享沙龙

里程碑丨Milvus在GitHub上的Stars数量突破30,000！

开源向量数据库性能对比: Milvus, Chroma, Qdrant

聊一聊：如何精确搜索到表达金桂飘香的古诗词

如何使用OpenAI文本Embedding模型构建AI系统

叮，这是一份来自Zilliz的近期活动高光回放

深度解读GraphRAG：如何通过知识图谱提升 RAG 系统

客户案例丨Milvus与CLIP模型在转转风控的应用

Milvus×Dify半小时轻松构建RAG系统

直播预告丨大模型与向量数据库会碰撞出怎样的火花

从Naive RAG到Agentic RAG：基于Milvus构建Agentic RAG

聊一聊：距离诺贝尔文学奖颁给AI还有多远？

孙悟空 + 红楼梦 - 西游记 = ？一文搞懂什么是向量嵌入

上海站nMeetup开始报名 | 10月26日下午，Zilliz与你相约Database+AI Infra

使用Milvus和Llama-agents构建更强大的Agent系统

不容错过：向心力｜中美 AI 应用与落地分享沙龙

知识图谱融入向量数据库，带来RAG效果飞升

Deep Dive丨多副本功能：提升QPS和系统可靠性

手把手系列丨如何利用 Milvus 实现多模态搜索

Forrester Wave™ 向量数据库报告：Zilliz 获评领导者象限最高分

我们是向量数据库的领军企业，我们只招TOP人才

快速实现AI搜索！Fivetran 支持 Milvus 作为数据迁移目标

如何全面洞察集群状态？Zilliz Cloud 发布监控告警系统新特性

如何更高效传输非结构化数据？Zilliz 推出全新数据迁移服务

直播预告丨Milvus在OPPO的语音与图像检索实践

Deep Dive | Zilliz Cloud正式推出 Serverless 版

科技企业如何做好全球化？Zilliz、Fotor、Answer.ai的经验与建议

活动预告｜Data Fun Summit 2024，Gen AI时代的向量数据库要怎么做

朋友圈装腔指南：如何用向量数据库把大白话变成古诗词

手把手系列｜一篇文章教会你使用有RAG功能的CAMEL框架

客户案例｜Zilliz Cloud 助力 MindStudio 搭建无代码平台，革新 AI 应用开发方式

使用 Milvus、vLLM 和 Llama 3.1 搭建 RAG 应用

官宣：Zilliz 在亚马逊云科技中国区正式开服！

图像与文本并存，多模态检索如何带来新的搜索革命

聊一聊：你最想用大模型实现的功能是什么

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉