首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

用LangChain的LLM Graph Transformer解锁构建知识图谱构的新姿势

文摘 2025-01-14 12:35 安徽

构建知识图谱是一个令人兴奋但充满挑战的任务，核心在于将非结构化的文本转化为结构化数据。

这种方法已经存在了一段时间，但随着 LLM 的出现，这项技术开始进入主流应用领域。

下图展示了将多篇文档中的文本信息（例如描述某人及其与公司的关系）转化为知识图谱。在左侧，我们看到的是原始的非结构化句子；而在右侧，这些信息被提取、组织，形成了实体和关系的可视化图谱，清晰地展现了“谁创立了什么公司”或“谁在哪些公司工作”等信息。

那么，为什么要将文本转化为结构化的知识图谱呢？

一个重要的应用场景是 RAG。虽然基于嵌入模型直接处理非结构化文本是一种有效的方法，但在回答复杂、多跳问题时会显得力不从心。例如：

需要理解多个实体间关系的问题。
需要进行过滤、排序、聚合等结构化操作的问题。

通过知识图谱，数据的组织变得更加高效，不仅可以支持更复杂的问题回答，还能显著提升准确性和适用性。

LLM Graph Transformer 旨在支持通过任意 LLM 构建知识图谱。面对当前多种模型和服务商的复杂生态，LangChain 通过标准化简化了这个过程，而 LLM Graph Transformer 则提供了强大的适应能力。

这个模块的核心特色在于它的“双模式设计”，可以根据场景需求选择不同的方式生成图谱，分别适应不同的操作逻辑。

基于工具的模式（默认模式）

适用场景：当 LLM 支持结构化输出或函数调用时。
实现方式：利用 LLM 的内置功能（如 with_structured_output），通过工具指定输出格式，将实体和关系提取为预定义的结构化数据。
优势：

输出结果一致性强，结构明确。
适合对精确性要求较高的任务。

基于提示的模式（备用模式）

适用场景：当 LLM 不支持工具或函数调用时。
实现方式：通过少样本提示（few-shot prompting），以自然语言指导 LLM 提取实体和关系。提取结果以文本形式输出，再通过自定义函数解析为 JSON 格式，用于生成节点和关系。
优势：

不依赖工具支持，适应性强。
适合探索性任务和初期实验。

这两种模式使 LLM Graph Transformer 能够适应不同的 LLM：

在工具支持的情况下，利用工具直接生成结构化数据。
在工具受限时，通过提示引导模型实现类似功能。

此外，即使在支持工具的模型中，也可以通过设置 ignore_tools_usage=True 强制启用基于提示的模式，以满足特定需求。

这种灵活性让 LLM Graph Transformer 能够高效适配多样化的 LLM，提供了统一且易用的知识图谱构建体验。

GitHub 链接：https://github.com/tomasonjo/blogs/blob/master/llm/llm_graph_transformer_in_depth.ipynb

PyTorch研习社

打破知识壁垒，做一名知识的传播者

最新文章

结合Neo4j与Milvus的图谱与向量搜索构建GraphRAG Agent

OpenAI o3-mini 干翻了 DeepSeek R1？

探索提升RAG系统问答质量的技术路线

微软CoRAG：提升多步骤问答任务的表现

5种LLM微调策略：动态图示清晰解析

RAG从入门到精通系列6：Retrieval（检索）

深度解析DeepSeek-R1——打造推理型大模型的配方

Model2Vec加速RAG：模型小15倍，速度快500倍：

RAG从入门到精通系列5：Indexing（索引）

RAG从入门到精通系列4：Query Construction（查询构造）

RAG中的5种文档切分策略：动态图示清晰解析

OpenAI发布的Operator是什么？

AI制裁无效！DeepSeek-R1、DeepSeek-V3和GRPO论文总结

Kimi k1.5：与全功率o1性能匹敌的LLM技术分析

DeepSeek-R1发布24小时后，AI行业反应怎么样？

DeepSeek-R1：一款革命性的国产开源推理LLM，挑战OpenAI的高性能模型

Medium上20万次阅读的思维链高级提示付费文章

RAG从入门到精通系列3：Routing（路由）

Agentic RAG实战：LangChain+LangGraph+Docling+ChromaDB

GitHub上41.3k颗星的2025年最新免费LLM课程

传统 RAG vs. Agentic RAG：动态图示清晰解析

吴恩达：AI产品管理的黄金时代已来，未来属于懂技术的PM！

RAG从入门到精通系列2：Query Translation（查询翻译）

OpenAI率先突围：AI自我进化

RAG从入门到精通系列1：基础RAG

LLM应用落地：购买GPU的最佳指南

用LangChain的LLM Graph Transformer解锁构建知识图谱构的新姿势

2025年这7种用于构建Agentic RAG系统的架构不可或缺

CAG能取代RAG吗？别被表面现象迷惑！

增强版o1模型：Search-o1=Agentic搜索+文档内推理机制

8000字文章的AI Agent全解析：工具、规划与失败模式的深度探索

传统的SaaS的将在2025 Agent时代走向终结

NVIDIA CES2025 大会凭什么震撼了整个 AI 领域？

2025如何学习Agent？谷歌重磅发布Agent白皮书

探索AI Agent工作流设计模式：构建智能任务协作的未来

微调提升LLM准确性，SQL查询任务实现从0%到90%准确率的突破！

用基于Qwen-2.5-7B的Code Agent打造本地、开源的Multi-Agent RAG系统

大模型不一定是最优解！小模型更适合企业？

四种腾讯最新的QO技术提高RAG系统的效率和准确性：扩展、分解、消歧、抽象

Graph RAG实战：使用知识图谱和AI检索、筛选和总结医学期刊文章

AGI前夜的思考：从o3到AGI，未来已来（前端可能没未来了）

2025 Agent之年：Anthropic万字文章披露如何构建高效的AI Agent系统

从创意到工作效率，谷歌为你整理了321个生成式AI在多个行业的变革性应用

万万没想到，一家中国量化基金公司年底发布了最强开源LLM：DeepSeek V3

2025年值得入坑AI Agent的五大框架

GPT之父从OpenAI离职！OpenAI“众叛亲离”对AI的发展或许是一件好事

ModernBERT在LLM时代重塑BERT的速度与效能

12天12大突破！OpenAI的创新狂潮，彻底改变未来科技

用 PydanticAI 构建智能体应用：评估驱动开发的新时代

HuggingChat：开源、自由、高效的生成式对话平台

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉