一个RAG与层次化Agent加持的落地案例

科技 2024-11-13 08:01 北京

智能设备的日益普及强调了维护在生产活动中的关键作用。交互式电子技术手册（IETMs）是支持智能设备维护的重要工具。传统的IETMs面临着从图形用户界面（GUIs）过渡到自然语言用户界面（LUIs）以及管理复杂逻辑关系的挑战。

为此，提出了一种基于大型语言模型的维护方案生成方法LLM-R，包括几个关键创新：

提出了低秩适应-知识保留（LORA-KR）损失技术，以比例调整混合维护数据，用于微调LLM。这种方法防止了由混合数据引起的知识冲突，提高了模型在特定维护领域的适应性和推理能力。
此外，采用了基于层次任务的Agent和指令级检索增强生成（RAG）技术来优化生成步骤，并减轻模型无法访问上下文信息时引起的幻觉现象。

LLM-R框架用于生成维护方案的关键步骤：

提取维护数据（Extraction of maintenance data）：

从设备的维护过程中提取相关的维护数据，包括历史维护记录、维护程序文档和其他相关技术信息。
这些数据为模型的训练和优化提供了丰富而准确的数据集。

组织数据格式（Organization of data format）：

将收集到的维护数据系统地组织，以满足LLM的数据输入格式要求。
包括数据清洗和转换为标准化、机器可读的格式。

划分训练和测试集（Division of training and test sets）：

将整理好的数据分为训练集和测试集。
训练集用于模型训练，测试集用于评估模型性能。
确保数据在划分时具有代表性，以便模型能够充分学习各种维护对象和方案之间的语义和逻辑关系。

基础模型（Base model）：

选择一个基础LLM进行进一步的训练和微调。
选择时考虑维护领域特定需求和数据特征，包括语言支持、覆盖范围和预训练数据集的架构。

训练模型（Training model）：

使用LORA-KR损失的监督微调技术，结合层次任务基础智能体和指令级RAG技术，对预训练的Transformer模型进行微调。
LoRA优化低秩适应层，通过最小化损失函数调整部分权重，以适应特定领域。
层次任务基础智能体使用LLM作为“大脑”分解维护任务，并使用指令级RAG技术整合外部信息。

测试和评估（Test and evaluation）：

使用测试数据对模型进行测试，并使用公式、语言模型和手动评估进行全面评估，确保在实际维护场景中的适用性。
测试数据包括已知和未知的维护对象/场景，以全面评估LLM-R在正常和小数据输入下的泛化能力。

整个过程的目标是使用LLMs分析复杂维护任务，并准确检索相应的维护方案。这种方法优化了传统IETMs中存在的机械输入问题，显著提高了维护人员处理复杂任务的效率。

LLM-R框架的结构和组件

包括三个关键部分：指令级RAG机制、LORA-KR损失和层次化任务基础Agent模块。

指令级RAG（Instruction-level RAG）：

指令级RAG技术作为智能体的核心工具，用于提高检索特定维护对象方案的效率和准确性。
用户或智能体识别维护任务的关键词后，这些关键词被输入到RAG工具中，转换为模型可以处理的向量格式，并与数据库中向量化的数据匹配，以找到最相似的项。
RAG在检索阶段使用BERT编码器进行最大内积搜索（MIPS），以选择相关的文本块用于生成输出。

LORA-KR损失（Supervised Fine-Tuning of LORA-KR loss）：

LORA-KR损失是一种新的正则化方法，结合了特定任务损失和领域独立知识正则化，以在微调模型时保持预训练知识领域的一致性。
包括任务特定损失（ℒCE）和领域独立正则化损失（ℒKL），通过动态调整权重（w）来平衡这两种损失。
LORA-KR损失通过结合任务特定交叉熵损失和领域独立KL散度正则化损失，在LoRA梯度更新中保持模型对原始预训练领域知识的记忆力，同时适应新任务领域。

层次化任务基础智能体（Hierarchical Task-Based Agent）：

为了克服LLM在处理未知或高度复杂需求时可能出现的幻觉现象，采用了层次化任务基础Agent技术。
LLM作为“中央大脑”组织和总结信息，而智能体作为“助手”提供额外的具体信息支持。
设计了三个具有不同功能的智能体，都使用微调后的ChatGLM3模型作为基础，分别负责解析用户输入、提供定制解决方案和将解决方案返回给基础LLM进行进一步优化。

为了验证所提出方法在维护任务中的有效性，使用不同领域的对象构建了一个维护方案数据集。实验结果表明，所提出方法生成的维护方案的准确率达到了91.59%，这表明了其在提高维护方案的智能性和引入设备维护的新技术方法方面的改进。

https://arxiv.org/abs/2411.04476LLM-R: A Framework for Domain-Adaptive Maintenance Scheme Generation Combining Hierarchical Agents and RAG

来源 | PaperAgent

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247550235&idx=5&sn=82f4ff345d2d7d7acb59d8c47064c4f3

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

教育部公布！25考研人数，再降50万！

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

一篇小型语言模型技术最新全面综述

M3DocRAG：文档问答用哪个多模态大模型效果最好？

已公示！“东方理工大学”，来了

聊一聊做角色扮演大模型的经验

绝对顶流！清华博导倾力编写的《图神经网络导论》pdf免费分享

最高9.0分！这16篇最高分ICLR2025论文必看！从生成模型到MOE等

ICLR 高分：深入研究多模态大模型的对齐策略

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

双非二战字节算法岗，拿下70k offer.....

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

微调图像大模型的经验分享

昨夜， LLM 已经彻底凉凉了...

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

微软开源角色Agents，直接模拟了整个世界~

2024最新神书-《大模型应用程序构建指南》免费pdf分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

已注销！985新校区，不建了

RAG黑盒被打开了，可视化RAGViz闪亮全场

LLM性能优化中的一些概念扫盲

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

Cursor一不小心把自家的底牌也放出来了~

[送5本]《动手学机器学习》上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

LLM性能优化中的一些概念扫盲

暴跌94%，裁员9600人。。。

[送5本]《大语言模型：原理、应用与优化》大模型未来发展方向大揭秘！

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

DRL2022新书-《深度强化学习》免费pdf分享

陶哲轩：计算机通用方法，往往比深奥的纯数学更能解决问题

中央批准：中央候补委员、教育部副部长，任C9大学书记

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人学者入选

上交2024最新-《动手学大模型》实战教程及ppt分享！

考古OpenAI RLHF基石之作：探索RL和RM阶段的Scaling Law

【完整视频】黄仁勋对话软银孙正义：打造AI代理和物理AI，强调企业必须在AI浪潮中找准定位

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

上交2024最新-《动手学大模型》实战教程及ppt分享！

饶毅：全世界没有一个学校把博士后纳入“非升即走”

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

一篇综述告诉你：如何用大语言模型设计算法

SFT洗数据，有多少细节？

LSTM+Transformer王炸创新，荣登Nature...

突发！三星7nm停供！

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉