高级检索增强生成 (RAG) 技术

文摘科技 2024-11-16 14:47 山东

在 2024 年 All Things Open 大会上，了解有关生成式 AI、向量数据库和 RAG 的新进展。

译自Advanced Retrieval-Augmented Generation (RAG) Techniques，作者 Tim Spann。

检索增强生成(RAG) 近年来随着其日益普及，经历了许多进步。在 10 月 28 日All Things Open (ATO) 2024的演讲中，我将介绍构建更好的 RAG 所需的一些技术。这些技术包括分块、选择嵌入模型和元数据结构化。

构建 RAG 系统的注意事项

构建 RAG 系统时，最重要的事情之一是使其能够处理您需要的数据类型。例如，文本有很多种类型——对话、文档、问答、讲座和正式文档。您还必须准确确定您需要从数据中获取什么：是所有文本的转储，还是您在寻找特定的见解，还是仅来自嵌入式图表的信息？

与任何其他数据项目一样，您需要进行分析以确定您正在使用哪些数据、您将如何提取数据，以及需要哪些充实和转换。您的决策包括成本、规模、模型许可证、嵌入数据的时间以及它是否符合您的数据规范。

使用向量数据库和 RAG 时，非常重要的一部分是确定使用哪种嵌入模型，这些模型来自 HuggingFace、OpenAI、Google、Meta、PyTorch、Jina AI、Mistral AI 或 Nomic A 等提供商。有些模型用于密集嵌入，例如 BAAI/bge-base-en-v1.5，它生成 768 维浮点数向量。还有一些稀疏嵌入模型，它们主要生成零。

您还需要决定使用哪些工具；许多新工具使构建 RAG 不那么依赖手动操作，例如 LangChain、LlamaIndex、LangChain4J 或 Spring AI。您还可以使用 AI 提取-转换-加载 (ETL) 工具，例如 DataVolo、Cloudera DataFlow、Airbyte、StreamNative UniConn、Apache Spark、Apache Flink、Ray 和 Fivetran。

展望 RAG 的未来

除了讨论 RAG 领域的新进展外，在我的 ATO 演讲中，我还将分享一些示例，并展望未来，届时新的模型、技术、向量数据库和 AI 的进步将为整个概念注入强大的动力。这些进步包括：

分块
嵌入模型选项
元数据结构化
GraphRAG
多语言与特定语言
多模态数据检索
查询增强
查询路由
分层索引
混合检索
代理 RAG
自我反思
查询路由
子查询

我还将简要概述一个使用 Milvus（一种开源向量数据库）的 RAG 系统，该系统将检索系统与生成模型相结合。通过将从 Milvus 快速检索到的智能上下文添加到您的提示中，您可以减少 LLM 的幻觉，这一点非常重要。

立即注册 ATO

立即注册参加 All Things Open，参加我于 2024 年 10 月 28 日星期一美国东部时间上午 10:30 进行的演讲“高级检索增强生成 (RAG) 技术”。

http://mp.weixin.qq.com/s?__biz=MzIzMzcxMTUxOQ==&mid=2247496053&idx=3&sn=b74629b79df881ae7f437d7375a13f06

云云众生s

关注云原生时代的普通人 - 云原生 | 平台工程 | AI

最新文章

KUBERNETES与菲律宾停电 – 在TAILSCALE上设置K0S

Cloud Foundry如何与Kubernetes共同发展

高级检索增强生成 (RAG) 技术

向量搜索的秘诀：训练嵌入模型

RIP开源核心—开源万岁

如何修复您的CNCF治理并赚钱

携手社区驱动开源共建未来

英伟达如何使用KUBEVIRT扩展其云服务

OPENTELEMETRY挑战：处理长时间运行的SPAN

为什么PYTHON开发人员应该关心测试

OVHCLOUD如何提升其800个数据库的效率

LLAMA STACK发布，助力开发者构建“代理应用”

GO中的机器学习与PYTHON SIDECAR

如何使用语义路由器和LLM工具构建AI代理

构建一个AI驱动的问答应用程序

AI增强代码的可追溯性：开发者指南

人工智能时代的工程团队技能提升

微软EDGE如何用WEB COMPONENTS替换REACT

代理将GENAI从订单接收者转变为合作者

使用机密虚拟机开始保护去中心化云

你应该知道的编程基本原理

EBPF即将登陆WINDOWS

AI模型应对灾难性遗忘的技术

人工智能代理即将改变您的数字生活

每个开发人员都应该知道的10个JAVASCRIPT SEO技巧

REST在许多API使用场景中仍然优于GRAPHQL

SPACEDRIVE：现代的跨平台文件管理器

UBUNTU LINUX：安装SURICATA入侵检测系统

开发者团队最大化Headless架构指南

微软EDGE如何用WEB COMPONENTS替换REACT

LINUX：使用RSNAPSHOT创建系统备份

使用机密虚拟机开始保护去中心化云

DEVOPS迈向自动化之外，应对新挑战

JAVASCRIPT 预计明年将推出新的时间、日期和集合功能

AI代理和COPILOT：SAP推出更深层次的集成

JAVASCRIPT注册中心的幕后故事

我们正在离开KUBERNETES

谷歌检查：面向应用和代码的AI驱动的合规性

云安全中的零信任：永不信任，始终验证

Linux内核6.12为卓越调度和实时操作做好准备

尝试“自上而下”的解决KUBERNETES蔓延问题

ANYSCALE：RAY的全新优化运行时，KUBERNETES OPERATOR

运行时上下文：KUBERNETES安全的缺失部分

在防火墙后部署KUBERNETES的技术

开发者游乐场：用途和设计模式

我最喜欢的5个命令行工具

如何使用安全即代码实现DEVSECOPS

PDF通过新的RAG架构更容易进入GENAI

平台工程最关键的第一个决定

DORA 2024：人工智能和平台工程未能达到预期

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉