使用 NLP 名词短语提取来提取概念及其共现
使用图形统计来优化概念图并提取分层社区结构
LazyGraphRAG效果评测
LazyGraphRAG数据索引成本与向量RAG相同,是完整GraphRAG成本的0.1%。 对于与向量RAG相当的查询成本,LazyGraphRAG在本地查询上超越了所有竞争方法,包括长上下文向量RAG和GraphRAG DRIFT搜索(我们最近引入的RAG方法,已被证明优于向量RAG)以及GraphRAG本地搜索。
相同的LazyGraphRAG配置还显示出与GraphRAG全局搜索相当的答题质量,但对于全局查询,查询成本降低了700多倍。
对于GraphRAG全局搜索查询成本的4%,LazyGraphRAG在本地和全局查询类型上显著超越了所有竞争方法,包括C2级别的GraphRAG全局搜索(社区层级中的第三层,推荐大多数应用使用)。
GraphRAG无价值了?
GraphRAG 实体、关系和社区摘要的数据索引具有超越问答的使用价值(例如,阅读和分享为报告)。 实体、关系和社区摘要的 GraphRAG 数据索引与类似 LazyGraphRAG 的搜索机制相结合,可能会比单独使用 LazyGraphRAG 取得更好的效果。 一种旨在支持类似 LazyGraphRAG 的搜索机制(例如,通过预先声明和主题提取)的新型 GraphRAG 数据索引可能会实现最佳结果。
https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/
来源 | PaperAgent