大模型基于有限的数据进行训练,具有很大的局限性,特别是对于有时效性的数据更是难于学习。此外,大模型本质上是条件概率模型,在生成过程中存在不可避免的幻觉。而RAG是解决这些问题的一套有效方案。RAG模型,又称“检索增强生成”,是一种利用外部来源获取的事实来增强生成式人工智能大模型准确性和可靠性的技术。它独特地结合了检索和生成两个环节。首先,RAG利用BERT等模型将问题和知识库内容转换为向量,并基于相似性找到top-k的相关文档。接着,这些文档被提供给基于Transformer的生成式大模型,进而生成答案。这种方法不仅提高了答案的质量,更重要的是,它也为模型的输出提供了可解释性。因此,RAG能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题,已被证明是一种解决大模型幻觉的有效方法。基本流程如下,其中包含两个主要的流程,数据准备和数据检索,前者是事先完成的流程。RAG的结构为特定行业大型语言模型的构建带来了巨大潜力。例如,在AI聊天机器人中,RAG技术使得机器人能够为特定领域如医疗、法律和金融提供更准确和有针对性的答案。RAG技术已为语言模型领域打开了新的大门,其面临的挑战是多方面的。处理超长文本时如何保留其逻辑与语义、确保高质量的检索结果,以及依赖于知识库的质量都是待克服的难题。其中,知识库的建设和维护尤为关键。未来的挑战还包括如何增强模型对复杂查询的鲁棒性和可解释性,确保其在各种应用场景中都能稳定表现。
由于Gemini在处理长上下文方面表现出色,甚至有人高喊“RAG已死”。据爱丁堡大学博士符尧在评价Gemini 1.5 Pro的帖子中写道:“一个拥有1000万token上下文窗口的大模型击败了RAG。但也有很多人认为并非如此,RAG技术的发展才刚刚起步,并且随着大型模型在处理长上下文和遵循指令方面的能力不断提升,RAG技术将持续发展迭代。
更多阅读...
《人工智能安全》
《Python爬虫大数据采集与挖掘》
IntBigData