运维行业大模型:提升运维知识问答准确性“四步法”

文摘   科技   2024-04-16 12:00   北京  

运维行业大模型:提升运维知识问答准确性“四步法”

亚信科技(中国)有限公司

企业运维工作是专业且严谨的,它确保着企业的信息系统稳定、高效地运转。要想让通用LLM(Large Language Model,大语言模型)在运维领域发挥作用,就像是让一个初入职场的实习生立刻成为行业专家一样,挑战不小。LLM“实习生”在回答企业运维问题时正确率仅为30%,显得力不从心,让我们一起分析下这位“实习生”的不足之处。

一、LLM“实习生”问题出在哪儿?


• 缺少专业运维知识:这位“实习生”在运维知识方面明显捉襟见肘,被问及负载均衡策略,竟回答“多放几台电脑”,专业度堪忧。


• 无法理解专业运维问题:面对一个关于数据库优化的复杂问题,他居然开始解释起数据库的基本结构,显然未能准确把握问题的核心要点。


• 难以精准定位答案:在回答一个关于系统监控的具体问题时,他居然从系统架构讲起,绕了一大圈,最后也没能找到直接相关的答案。


• 回答发散泛泛而谈:被问及如何防范DDoS攻击,他居然从网络安全讲到了全球信息战的层面,虽然内容精彩,但显然偏离了问题的实际范围。

为了让这位“实习生”摇身一变成为“企业专属运维专家”,我们设计了一套“运维问答效果增强四步修炼法”。


二、运维问答效果增强的四步修炼法


这套方法融合了RAG(Retrieval Augmented Generation,检索增强生成)+ LLM微调+Embedding模型微调+Prompt等多种技术,旨在让LLM不仅拥有丰富的知识,还能准确理解问题、快速定位答案,并流畅地组织语言给出专业回答。


Step1:恶补企业运维知识,懂得更多

将企业Excel、Word、PDF等各种形式的零散运维文档进行切分,通过Embedding模型向量到数据库中(即将文字信息转换成计算机能够理解和计算的数字),补充LLM“实习生”企业运维知识。实际项目中完成知识向量化导入后,利用cosine相似度进行语义匹配,问答准确率提升15%左右。


Step2:学习企业运维术语,理解更到位

仅有知识还不够,我们还需要准确理解用户的问题。基于企业运维问答数据对LLM进行精调,学习企业运维专业术语(如:“卡单”等 ),增强LLM意图理解能力,帮助LLM“实习生”更准确理解用户专业的运维问题,问答准确率提升16%。


Step3:分类分层+模型优化,答得更准

首先,通过模型对问题进行细致的分类,从而大幅缩小检索范围,提高答案的针对性;

然后,按照FAQ、切分文档片段、LLM生成答案三个层级逐层递进匹配答案;

最后尤为关键的是,基于运维领域数据对Embedding模型进行微调优化,并对召回的TOP3进行Reranking,提高向量匹配精准度。

经过这一系列精心设计的步骤,LLM“实习生”在实践中的问答准确率大幅提升了25%,效果显著。LLM“实习生”离成为企业运维专家,似乎只差微乎其微的一点点距离了。


Step4:提升语言组织能力,答得更好

通过特定的Prompt提示词限制,确保LLM在回答问题时既严谨又专注,不会偏离主题。这使得准确率再次提升了5%。


三、LLM的华丽转身


经过四步修炼法,这位LLM“实习生”真正做到了懂得多、理解好、答到准且答得好,运维问题回答正确率由30%提升到91%,成为一名名副其实的“企业专属运维专家”,在企业运维领域大放异彩。然而,四步修炼法虽然看似简单,但其背后的参数设置、文档切分、数据处理、模型调优以及模型验证等环节,无一不需要经验丰富的专业团队来保驾护航,才能确保整个修炼过程的顺利进行,呈现最佳效果。

亚信科技新技术探索
亚信科技的ICT前沿技术观点与行业洞见。展现亚信新技术与产品行业实践成果。
 最新文章