大模型在有线家宽运维中的应用与思考

学术 2024-11-20 06:00 北京

‍‍

随着家庭宽带客户需求的提升，网络运维流程复杂、专家人力不足、不同专业领域运维人员沟通障碍，制约了运维效率和用户体验的提升。LLM技术可实现自动化问题诊断、实时故障排查等功能，有助于提升运维效率。然而，引入LLM也面临模型准确性、数据隐私、响应速度和知识更新等挑战。为应对这些问题，本文提出了将LLM与专家知识库结合、引入联邦学习、模型轻量化等方案，以提高其应用效果。

引言

近年来，随着在线教育、视频直播等业务的迅速发展，用户对有线宽带上网质量提出了更高的要求。有线宽带业务涉及终端设备、家庭网络、接入网、骨干网以及业务平台等。其中任意的网元、终端设备或线路出现问题，可能都会造成用户上网慢上网断等问题。为快速有效解决这些问题，通常需要宽带运维人员及时进行线下故障定位和修复。在这个过程中，通常会遇到如下问题。

涉及多个技术领域，响应速度受限。当遇到复杂故障时，工单提交给调度中心，再由多个技术领域的专家协同进行处理。这种多层级的操作链条延长了问题解决的时间，尤其在高峰期可能导致响应延迟、运维修复时间长，影响用户体验。

专家资源紧张。运维专家往往需要处理来自多地的大量工单，工作压力大且任务堆积，可能会影响到问题的及时处理。此外，由于对专家的专业知识要求较高，短时间内难以培养更多专家。

运维人员与专家间的沟通障碍。运维人员与专家通常需要对故障进行沟通确认，但由于设备状况、问题描述可能存在差异，导致沟通效率低下。

针对上面各种问题，近两年蓬勃发展的大语言模型（Large Language Models, LLMs）技术可以在此场景中发挥显著作用，尤其在减少人工干预、优化流程、提高效率等方面具有明显的优势。

大语言模型逐步在运维中得到应用

大语言模型近年来在自然语言处理领域取得了飞跃性进展。大模型基于深度学习尤其是神经网络中的变换器（Transformer）架构，能够处理大规模数据并生成极具流畅性和上下文感知的文本。代表性的大语言模型包括OpenAI的GPT系列、Google的BERT和PaLM系列、Meta的LLaMA、Anthropic的Claude等。这些模型不仅在自然语言处理领域得到应用，许多公司也开始将其嵌入到智能助手、虚拟客服等系统中。此外，大模型还能协助企业进行数据分析和信息抽取，帮助决策者更快获取有效信息。大模型在这些方面取得的进展，为其在有线宽带运维场景的应用提供了新思路。

大语言模型可基于运维人员获知的故障描述，自动分析出可能的故障原因，并生成详细的排查和修复建议，供运维人员参考。对于复杂度较低的问题，模型能够直接指导运维人员完成操作。

此外大模型还可以辅助运维人员完成特定的后台操作。通过将后台的操作逻辑融入模型中，运维人员可以在现场实时调用模型，直接完成一些常规的后台操作，无需等待调度中心的批准和操作。

使用大语言模型面临的问题与解决方案

在有线宽带运维领域引入大模型技术，虽然具备优化流程和提升运维质量的潜力，但也面临一些实际挑战。

模型准确性与鲁棒性不足

大模型的准确性和鲁棒性直接影响其在运维场景下的有效性。运维问题多样化且复杂，例如不同地区、设备的网络环境不同，可能导致模型在处理实际故障时出现偏差。若模型提供的诊断不准确或建议错误，不仅可能延长解决时间，还会影响用户的体验和信任度。

解决方案：可以通过将模型与运维专家的知识库结合，进行持续微调以提升精确性，将装维领域的最新知识向量化并存储到知识库中，通过检索增强生成（RAG）技术保持模型的“知识”与行业动态同步，并定期在专家指导下更新知识库，这样就可以有效避免频繁对模型进行训练和微调的成本开销。专家知识库同样可以解决领域知识更新的问题，此外还可以设置反馈机制，通过装维人员的反馈不断优化知识库中专业知识，确保其准确性和丰富度，使模型能够学习不同地区和设备的故障特性。

数据隐私与安全合规性

宽带运维涉及用户的网络数据、账户信息等敏感内容。在处理这些信息时，模型的隐私保护和数据合规要求必须严格。模型使用的数据可能包括敏感的客户数据，如何确保数据的保密性和合法性是引入大模型的关键。

解决方案：可以采用联邦学习等技术，保证模型能够在不直接访问用户敏感数据的情况下进行学习。同时，可对数据进行脱敏处理，将用户信息转换为非关联数据。此外，还应符合相关数据隐私法规，如《网络安全法》及《数据安全法》等，确保在开发和应用模型时符合法律要求。

实时性与响应速度

运维场景中，用户期望问题能得到及时解决。大模型的推理速度在高负载下可能较慢，特别是在资源有限的场景中。

解决方案：可将大模型进行轻量化处理，例如使用知识蒸馏技术或开发模型的微调版本以提高响应速度。还可以将模型部署到边缘计算设备上，在本地完成实时推理，从而提升响应速度。

高昂的计算与运维成本

大模型的训练和推理过程需要大量计算资源，尤其在微调和更新时，计算成本更高。此外，大规模部署大模型时，消耗的电力也是一笔不小的开支。

解决方案：可将模型微调集中于高优先级的故障类型和常见问题，避免对所有运维情况使用统一的大模型。此外，可以使用云端+边缘计算的混合架构，在需要大规模计算时调用云端模型，而边缘设备仅保留关键功能。

领域知识更新与模型的持续维护

宽带运维领域的知识随着技术和设备的进步不断更新，而模型一旦部署，需要定期更新才能准确反映新的故障模式和解决方案。若更新滞后，模型的建议可能会失去时效性，甚至对运维人员产生误导。

解决方案：将运维领域的最新知识融入模型微调流程中，并定期在专家指导下更新模型参数，以保持模型的“知识”与行业动态同步。此外，可以设置反馈回路，通过运维人员的反馈不断优化模型，确保其适应性和准确性。

幻觉问题带来的风险

大模型在生成响应时可能会产生“幻觉”，即提供看似合理但实际错误的答案。这种错误在运维领域可能带来严重后果，例如错误的修复建议或误导性的网络配置调整，可能导致用户故障进一步加剧。

解决方案：在模型生成建议时可增加可信度评级或信息源引用，以帮助运维人员判断结果的准确性。同时，在模型架构中加入“校验层”，确保模型输出符合已知事实或已有流程。另外，也可以在模型生成结果之前加入多轮确认机制，进一步提升结果可靠性。

大模型技术在宽带运维领域具有巨大的应用潜力。通过引入新技术方案、对系统进行合理部署和持续优化，大模型一定会在提升运维效率、增强用户体验方面发挥关键作用。

[参考文献]
[1] FAN W, DING Y, NING L, 等. A Survey on RAG Meeting LLMs: Towards Retrieval-Augmented Large Language Models[A/OL]. arXiv, 2024[2024-09-12]. http://arxiv.org/abs/2405.06211.
[2] GAO Y, XIONG Y, GAO X, 等. Retrieval-Augmented Generation for Large Language Models: A Survey[A/OL]. arXiv, 2024[2024-06-18]. http://arxiv.org/abs/2312.10997.
[3] ZENG S, ZHANG J, HE P, 等. The Good and The Bad: Exploring Privacy Issues in Retrieval-Augmented Generation (RAG)[A/OL]. arXiv, 2024[2024-05-18]. http://arxiv.org/abs/2402.16893.
[4] SALEMI A, ZAMANI H. Evaluating Retrieval Quality in Retrieval-Augmented Generation[C/OL]//Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval. Washington DC USA: ACM, 2024: 2395-2400[2024-10-09]. https://dl.acm.org/doi/10.1145/3626772.3657957. DOI:10.1145/3626772.3657957.
[5] BUBECK S, CHANDRASEKARAN V, ELDAN R, 等. Sparks of Artificial General Intelligence: Early experiments with GPT-4[M/OL]. arXiv, 2023[2023-03-29]. http://arxiv.org/abs/2303.12712.
[6] SOBANIA D, BRIESCH M, HANNA C, 等. An Analysis of the Automatic Bug Fixing Performance of ChatGPT[M/OL]. arXiv, 2023[2023-03-29]. http://arxiv.org/abs/2301.08653.
[7] Brown, T.B., Mann, B., Ryder, N., Subbiah, M., Kaplan, J., Dhariwal, P., Neelakantan, A., Shyam, P., Sastry, G., Askell, A., Agarwal, S., Herbert-Voss, A., Krueger, G., Henighan, T., Child, R., Ramesh, A., Ziegler, D.M., Wu, J., Winter, C., ... Dauphin, Y. (2020). Language models are few-shot learners. In Advances in Neural Information Processing Systems.
[8] Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI LP.

审稿：李连源、葛欣、吴博 | 业务研究所

本文作者

李虓 业务研究所

就职于中国移动研究院，主要从事有线宽带质量自动监测等领域研究工作。

陈德威 业务研究所

就职于中国移动研究院，主要从事数联网与大语言模型等领域研究工作。

王静 业务研究所

就职于中国移动研究院，主要从事电视业务流程与质量分析等领域研究工作。

往

期

精

彩

关于我们：中移智库以中国移动研究院为主体建设，广泛汇聚数字经济研究力量，着力提升政策性课题研究的专业性和权威性，并扩大研究成果的影响力、公信力、传播力，为数字经济的高质量发展贡献智慧力量。

http://mp.weixin.qq.com/s?__biz=MzAwMTA3ODExOQ==&mid=2651746262&idx=1&sn=0fdba01a935da7e4958b60d5493b0c70

中移智库

中移智库以中国移动研究院为主体建设，广泛汇聚数字经济研究力量，着力提升政策性课题研究的专业性和权威性，并扩大研究成果的影响力、公信力、传播力，为数字经济的高质量发展贡献智慧力量。联系我们：cminfo@chinamobile.com

最新文章

中国移动总经理何飚：打造卓著品牌共创新质未来

面向新型工业化的5G-A×AI 技术白皮书

智能体验感知技术之UE Logo

6G通感算智融合技术体系白皮书（1.0）

国际发展环境洞察（2024年第十期）

6G网络协作通感技术白皮书（2.0）

新一代信息技术经济月报（2024年第11期）

中国移动王晓云：商业价值既是6G的出发点，也是落脚点

检索增强生成（RAG）技术及应用浅析

一文读懂智算异构混合并行训练技术（下）

中国移动主办2024年世界互联网大会乌镇峰会数字化绿色化协同转型发展论坛

一文读懂智算异构混合并行训练技术（上）

5G消息产业发展分析与展望

6G：从通信到多能力融合的变革

时频统一全双工UDD关键技术

3GPP R18无线技术标准概览

大模型在有线家宽运维中的应用与思考

3D世界模型：引领人工智能迈向空间智能的新时代

HuggingFace与开源生态：引领人工智能创新的新动力

什么是“高质量”数据集？梧桐大数据探索构建人工智能高质量数据集评测体系

中国移动集团首席科学家冯俊兰：通用智能时代的思考

中移智库月度热文TOP10

对数据要素发展的思考与建议

全球卫星互联网季度观察（2024年11月）

银发经济月度观察（2024年10月）

无源物联核心网技术研究与标准推进

3D内容生成技术及应用场景探究

泛XR产业发展白皮书

提示工程——大模型中的提示词设计（下）

中国移动研究院多项成果入选国务院国资委课题成果集

提示工程——大模型中的提示词设计（上）

6G网络内生AI技术白皮书（1.0）

6G通感算智融合原生基座技术白皮书

NR ATG标准化概述

实时通信融合AI平台重构话音生态

OISA打造GPU卡间开放互联生态

中国移动杨杰：打造原创技术策源地提升信息通信话语权

“弈衡”多模态大模型评测体系白皮书

5G-A赋能绿色通信：节能标准进展，挑战与展望

一文读懂裸眼3D技术

AI赋能空天地海一体化网络资源管理

中国移动研究院张滨：骚扰电话治理关键要以“智”助“治”

新一代信息技术经济月报（2024年第10期）

国际发展环境洞察（2024年第九期）

SIM卡产业链国产化现状简析

品牌科技形象塑造经验及思考

5G小基站发展现状和发展趋势

移动研究院黄宇红：低空经济安全起飞，要牵牢通信这根“风筝线”

高精度工业视觉检测技术与应用白皮书（2024年）

数据生成技术在工业领域的应用与展望

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉