今天是2024年12月15日,星期日,北京,天气晴。
今天,我们继续来总结RAG,看4张图,一个是RAG的三张图:从模式、痛点到最佳实践。一个是再回首大模型时代工程开发相关工具,这些比看理论要好得多;
2024年转眼就剩最后半个月了,大家继续加油;
供各位参考,多思考,多总结,多实践;
一、关于RAG的三张图:从模式、痛点到最佳实践
1、RAG的7种常用模式
这个总结的图画的真不错,来自(https://twitter.com/shao__meng/status/1866626166079230355?s=46&t=1AUvwyftFbcog4yHzgnysw),大家可看看:
1)NaiveRAG是最基础的架构,包含简单的文档检索、处理和生成响应的流程;
2)Retrieve-and-rerank在基础RAG上增加了重排序步骤,可以优化检索结果的相关性;
3)MultimodalRAG能够处理图像等多种类型的数据,不仅限于文本;
4)GraphRAG利用图数据库增强知识连接,可以更好地理解文档间的关系;
5)HybridRAG结合了多种技术的优势,包含图结构和传统检索方法;
6)AgenticRAGRouter使用AIAgent来路由和处理查询,可以选择最适合的处理路径;
7)AgenticRAGMulti-Agent使用多个专门的AIAgent协同工作,可以调用不同的工具(如向量搜索、网页搜索、Slack、Gmail等)
2、RAG的12个痛点和应对策略
来自:https://towardsdatascience.com/12-rag-pain-points-and-proposed-solutions-43709939a28c
分阶段地将RAG的坑点进行了分类,分成了12个,然后也给出了对应的解决手段;
3、RAG的最佳实践
《Searching for Best Practices in Retrieval-Augmented Generation》(https://arxiv.org/pdf/2407.01219)
整个RAG可以分为:query classification(确定给定的输入查询是否需要检索)、retrieval(有效地获取查询的相关文档)、reranking(根据检索文档与查询的相关性改进检索文档的顺序)、repacking(将检索的文档组织成结构化的文档以便更好地生成)、summarization(从重新打包的文档中提取用于生成响应的关键信息并消除冗余)模块。
二、再回首大模型时代工程开发相关工具
可以看这个图,挺不错的,涵盖从开发、测试到部署的完整工作流程,人生苦短,用好开发工具:https://x.com/bytebytego/status/1855126891835146528
1)Development Env(开发环境):VS Code、Visual Studio、IntelliJ IDEA、Notepad++、Vim、PyCharm、Jupyter Notebook
2)Diagramming(图表工具):http://draw.io、excalidraw、mindmap、Mermaid、PlantUML、Microsoft Visio、Miro
3)AI Tools(人工智能工具):ChatGPT、GitHub Copilot、Tabnine、Claude、ollama、Midjourney、Stable Diffusion
4)Hosting & Deployment(托管和部署):AWS、Cloudflare、GitHub、http://Fly.io、Heroku、Digital Ocean
5)Code Quality(代码质量):Jest、ESLint、Selenium、sonarQube、FindBugs、Checkstyle
6)Security(安全工具):1Password、LastPass、OWASP、snyk、Nmap
7)Note-taking(笔记工具):Notion、Markdown、Obsidian、Roam、Logseq、Tiddly Wiki
8)Design(设计工具):Figma、Sketch、Adobe Illustrator、Canva、Adobe Photoshop
总结
本文主要介绍了3张关于RAG从模式、痛点到最佳实践的总结图以及。大模型时代工程开发相关工具,这些比看理论要好得多。
大模型退潮时候,工程能力总会更加重要,多实践,多总结;
关于我们
老刘,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。
对大模型&知识图谱&RAG&文档理解感兴趣,并对每日早报、老刘说NLP历史线上分享、心得交流等感兴趣的,欢迎加入社区,社区持续纳新。
加入会员方式:关注公众号,在后台菜单栏中点击会员社区->会员入群加入