RAG常见模式、痛点及最佳实践总结4张图:兼看大模型时代的工程开发工具集合

文摘   2024-12-15 19:16   北京  

今天是2024年12月15日,星期日,北京,天气晴。

今天,我们继续来总结RAG,看4张图,一个是RAG的三张图:从模式、痛点到最佳实践。一个是再回首大模型时代工程开发相关工具,这些比看理论要好得多;

2024年转眼就剩最后半个月了,大家继续加油;

供各位参考,多思考,多总结,多实践;

一、关于RAG的三张图:从模式、痛点到最佳实践

1、RAG的7种常用模式

这个总结的图画的真不错,来自(https://twitter.com/shao__meng/status/1866626166079230355?s=46&t=1AUvwyftFbcog4yHzgnysw),大家可看看:

1)NaiveRAG是最基础的架构,包含简单的文档检索、处理和生成响应的流程;

2)Retrieve-and-rerank在基础RAG上增加了重排序步骤,可以优化检索结果的相关性;

3)MultimodalRAG能够处理图像等多种类型的数据,不仅限于文本;

4)GraphRAG利用图数据库增强知识连接,可以更好地理解文档间的关系;

5)HybridRAG结合了多种技术的优势,包含图结构和传统检索方法;

6)AgenticRAGRouter使用AIAgent来路由和处理查询,可以选择最适合的处理路径;

7)AgenticRAGMulti-Agent使用多个专门的AIAgent协同工作,可以调用不同的工具(如向量搜索、网页搜索、Slack、Gmail等)

2、RAG的12个痛点和应对策略

来自:https://towardsdatascience.com/12-rag-pain-points-and-proposed-solutions-43709939a28c

分阶段地将RAG的坑点进行了分类,分成了12个,然后也给出了对应的解决手段;

3、RAG的最佳实践

《Searching for Best Practices in Retrieval-Augmented Generation》(https://arxiv.org/pdf/2407.01219)

整个RAG可以分为:query classification(确定给定的输入查询是否需要检索)、retrieval(有效地获取查询的相关文档)、reranking(根据检索文档与查询的相关性改进检索文档的顺序)、repacking(将检索的文档组织成结构化的文档以便更好地生成)、summarization(从重新打包的文档中提取用于生成响应的关键信息并消除冗余)模块。

二、再回首大模型时代工程开发相关工具

可以看这个图,挺不错的,涵盖从开发、测试到部署的完整工作流程,人生苦短,用好开发工具:https://x.com/bytebytego/status/1855126891835146528

1)Development Env(开发环境):VS Code、Visual Studio、IntelliJ IDEA、Notepad++、Vim、PyCharm、Jupyter Notebook

2)Diagramming(图表工具):http://draw.io、excalidraw、mindmap、Mermaid、PlantUML、Microsoft Visio、Miro

3)AI Tools(人工智能工具):ChatGPT、GitHub Copilot、Tabnine、Claude、ollama、Midjourney、Stable Diffusion

4)Hosting & Deployment(托管和部署):AWS、Cloudflare、GitHub、http://Fly.io、Heroku、Digital Ocean

5)Code Quality(代码质量):Jest、ESLint、Selenium、sonarQube、FindBugs、Checkstyle

6)Security(安全工具):1Password、LastPass、OWASP、snyk、Nmap

7)Note-taking(笔记工具):Notion、Markdown、Obsidian、Roam、Logseq、Tiddly Wiki

8)Design(设计工具):Figma、Sketch、Adobe Illustrator、Canva、Adobe Photoshop

总结

本文主要介绍了3张关于RAG从模式、痛点到最佳实践的总结图以及。大模型时代工程开发相关工具,这些比看理论要好得多。

大模型退潮时候,工程能力总会更加重要,多实践,多总结;

关于我们

老刘,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。

对大模型&知识图谱&RAG&文档理解感兴趣,并对每日早报、老刘说NLP历史线上分享、心得交流等感兴趣的,欢迎加入社区,社区持续纳新。

加入会员方式:关注公众号,在后台菜单栏中点击会员社区->会员入群加入


老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
 最新文章