RAG黑盒被打开了，可视化RAGViz闪亮全场

科技 2024-11-18 00:01 北京

CMU（卡内基梅隆大学）开源RAGViz：它提供了对检索文档和模型注意力的可视化，帮助用户理解生成的标记与检索文档之间的交互，可用于诊断和可视化RAG系统。

Query=“为什么猪会飞？”的可视化。突出显示的生成内容没有基于任何上下文文档，展示了内部幻觉。

RAGViz特性和用例

注意力可视化：RAGViz通过标记高亮显示来可视化生成的标记序列对输入标记的关注度，并通过颜色强度来衡量关注度。
文档级别的关注度：展示生成输出对每个检索段落的关注度，以累积文档级别的注意力分数形式展现。
拖动选择用户界面：用户可以通过拖动选择来轻松检查任何标记序列的累积关注度。
文档切换功能：用户可以选择在构建答案上下文时省略特定的标记和文档，以比较添加或移除标记和文档对LLM输出的影响。
自定义上下文文档数量：用户可以指定从数据集中检索的相关文档片段的数量。
API密钥认证：RAGViz实现了HTTP请求上的中间件功能，以确保请求经过适当的认证。

在使用文档切换功能时，对选定的标记序列进行注意力可视化

演示了RAGViz识别和调试外部幻觉的能力

RAGViz系统架构

RAGViz的系统架构包含四个主要组件：近似最近邻（ANN）索引、后端服务器、LLM推理服务器和前端用户界面。这些组件被设计为可以独立配置，以提高灵活性。

ANN索引（Dense Retrieval）：

在密集检索中，查询和文档被编码成高维特征向量，然后通过相似性搜索（如余弦相似度或内积）来确定查询向量的最近邻居。
RAGViz使用分布式系统来存储和索引这些向量，每个节点存储一部分向量并提供REST API来返回查询的近似最近邻。

上下文构建器（Context Builder）：

后端服务器处理构建语言模型上下文的所有逻辑，包括加载嵌入模型、管理后端逻辑和存储完整语料库。
接收到的查询经过认证后被编码成嵌入向量，并路由到所有工作节点进行ANN搜索。
从每个工作节点检索到的顶部文档会被重新排序，以返回整个数据集中查询的最终最近邻。
RAGViz提供两种文档片段提取方法：naive first（简单首段）和sliding window（滑动窗口）。

生成和注意力输出（Generation and Attention Output）：

RAGViz需要一个GPU节点来运行LLM推理任务。
系统使用vLLM库进行快速LLM推理，生成文本，但由于vLLM不支持注意力输出，系统随后使用HuggingFace模型库来获取注意力分数。
这些分数通过对所有头和层的文档窗口的平均值来计算累积的文档级别注意力分数。

前端用户界面（Frontend User Interface）：

前端用户界面基于Next.JS框架构建，并作为静态文件托管在Apache web服务器上。
用户界面使用表单收集查询信息和其他参数，并在接收到后端的注意力分数后，将它们存储在React状态中以用于注意力可视化。
用户可以通过拖动选择输出标记来检查累积关注度，前端会突出显示文档中相关度高的标记。
前端还提供切换文档包含状态的按钮，并将带有更新文档集的新查询路由到重写端点。

展示了窗口大小为5、步长为2的滑动窗口片段提取方法的演示。滑动窗口方法选择具有最高内积相似度的片段。相反，简单首段方法总是选择显示为绿色的首个窗口。

https://github.com/cxcscmu/RAGViz. demo video of RAGViz https://youtu.be/cTAbuTu6ur4https://arxiv.org/pdf/2411.01751RAGVIZ: Diagnose and Visualize Retrieval-Augmented Generation

来源 | PaperAgent

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247550555&idx=2&sn=2aafc273b2b3c3c36dea032a65b13240

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

教育部公布！25考研人数，再降50万！

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

一篇小型语言模型技术最新全面综述

M3DocRAG：文档问答用哪个多模态大模型效果最好？

已公示！“东方理工大学”，来了

聊一聊做角色扮演大模型的经验

绝对顶流！清华博导倾力编写的《图神经网络导论》pdf免费分享

最高9.0分！这16篇最高分ICLR2025论文必看！从生成模型到MOE等

ICLR 高分：深入研究多模态大模型的对齐策略

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

双非二战字节算法岗，拿下70k offer.....

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

微调图像大模型的经验分享

昨夜， LLM 已经彻底凉凉了...

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

微软开源角色Agents，直接模拟了整个世界~

2024最新神书-《大模型应用程序构建指南》免费pdf分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

已注销！985新校区，不建了

RAG黑盒被打开了，可视化RAGViz闪亮全场

LLM性能优化中的一些概念扫盲

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

Cursor一不小心把自家的底牌也放出来了~

[送5本]《动手学机器学习》上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

LLM性能优化中的一些概念扫盲

暴跌94%，裁员9600人。。。

[送5本]《大语言模型：原理、应用与优化》大模型未来发展方向大揭秘！

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

DRL2022新书-《深度强化学习》免费pdf分享

陶哲轩：计算机通用方法，往往比深奥的纯数学更能解决问题

中央批准：中央候补委员、教育部副部长，任C9大学书记

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人学者入选

上交2024最新-《动手学大模型》实战教程及ppt分享！

考古OpenAI RLHF基石之作：探索RL和RM阶段的Scaling Law

【完整视频】黄仁勋对话软银孙正义：打造AI代理和物理AI，强调企业必须在AI浪潮中找准定位

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

上交2024最新-《动手学大模型》实战教程及ppt分享！

饶毅：全世界没有一个学校把博士后纳入“非升即走”

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

一篇综述告诉你：如何用大语言模型设计算法

SFT洗数据，有多少细节？

LSTM+Transformer王炸创新，荣登Nature...

突发！三星7nm停供！

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉