▼最近直播超级多,预约保你有收获
—1—
第一阶段:Naive RAG 架构设计
大型语言模型(LLMs)虽然展现出卓越的性能,但在处理特定领域或知识密集型任务时,存在一些挑战,比如:产生虚假信息、知识陈旧以及推理过程的非透明性和不可追溯性。RAG 技术作为一种有希望的解决方案,通过融合外部数据库的知识,有效应对了这些问题。它显著提升了生成内容的准确性和可靠性,尤其在知识密集型任务中表现突出,并支持知识的持续更新及特定领域信息的整合。
—2—
第二阶段:Advanced RAG 架构设计
Query 理解(Query NLU):利用 LLM 作为核心引擎,对用户 Query 进行改写以提升检索效果,涉及意图识别、歧义消除、Query 分解、抽象等七个技术点。
Query 路由(Query Routing):查询路由是 LLM 支持的关键决策环节,决定了用户查询的下一步行动,包含一项核心技术。
索引(Indexing):作为 RAG 中的核心模块,索引包括文档解析(五种工具)、文档切块(五类方法)、嵌入模型(六种类型)、索引类型(三种分类)等,共计八项技术。
Query 检索(Query Retrieval):除了 Naive RAG 向量检索外,还关注图谱和关系数据库检索(NL2SQL),共涉及三项技术。
重排(Rerank):不同检索策略的结果需要通过重排来优化,包括重排器类型(五种)和自训练领域重排器等,共计三项技术。
生成(Generation):在企业应用中,生成环节可能会遇到重复、幻觉、流畅性、美化、溯源等问题,涉及 RLHF、偏好打分器、溯源 SFT、Self-RAG 等七项技术。
评估与框架:RAG 需要一个全链路的评价体系,作为企业上线和迭代的依据,包括三项技术。
RAG 新技术:探讨 RAG 未来的发展方向及实现路径,共提出三项潜在的新技术。
—3—
第三阶段:Agentic RAG 架构设计
最终,大模型 RAG 问答终章是 Agentic RAG!
向Lv2-智能体提出一个问题。
while (Lv2-智能体无法根据其记忆回答问题) {
Lv2-智能体提出一个新的子问题待解答。
Lv2-智能体向Lv1-RAG提问这个子问题。
将Lv1-RAG的回应添加到Lv2-智能体的记忆中。
}
Lv2-智能体提供原始问题的最终答案。
第一个子问题:“第五交响曲是在哪个世纪创作的?”
第二个子问题:“19 世纪发明的交通工具是什么?”
—4—
直播课免费预约
为了帮助同学们彻底掌握大模型的 RAG、向量数据库、Agent、微调等的应用开发、部署、生产化,今天会开2场直播,请同学们点击以下预约按钮免费预约。
—5—
加我微信
有很多企业级落地实战案例,不方便公开发公众号,我会直接分享在朋友圈,欢迎你扫码加我个人微信来看👇
⬇戳”阅读原文“,立即预约!
END