以ChatGPT为代表的大型语言模型(LLMs)的迅猛发展,极大地改变了自然语言处理领域的研究范式。LLMs拥有强大的语言理解和生成能力,将逐渐成为构建智能交互系统的核心。本文聚焦于网络故障监控领域,基于实践分享LLMs在自适应故障场景监控的相关经验,以期为关注该议题的企业或学者提供更精准、高效的参考。
在可视化场景监控中,关键要素包括:实时监控、多维度展示、预警提示、数据分析和数据共享。这些要素共同作用,帮助监控人员更加准确地了解受监控设备的运行状况,及时进行处理和决策,从而提高监控效率和管理水平。
• 实时监控:可视化大屏能够将告警、性能、日志等监控数据实时展示在大屏上,使监控人员能够及时了解监控数据的变化情况,从而迅速做出反应。
• 多维度展示:通过将不同维度的告警、性能、日志等监控数据进行多维度展示,帮助监控人员全面了解监控数据的情况,从而更加准确地判断和分析问题。
• 预警提示:可视化大屏可以设置预警提示功能,当监控数据发生异常时,大屏会自行变更图标样式并弹出警示界面,提醒监控人员进行处理和决策。
• 数据分析:将告警、性能、日志等监控数据进行数据分析和趋势分析,帮助监控人员了解监控数据的变化趋势,从而更加准确地预测和预防问题的发生。
• 数据共享:可视化大屏可以将监控数据进行共享,让不同部门和人员都能够了解监控数据的情况,从而更加协同地进行处理和决策。
通过这些关键要素的综合应用,可视化场景监控能够显著提高监控效率和准确性,对于保障生产安全、提升管理效率具有重要意义。
可视化的人机交互历程经历了多个阶段:
• 命令行视图(CLI):用户通过输入特定的指令与计算机进行交互。
• 图形用户视图(GUI):用户通过鼠标和键盘操作图形化的界面元素,如窗口、图标和菜单。
• 自然用户视图(NUI):用户通过语音、手势、触摸等自然方式与计算机进行交互。
• 自适应用户视图:能够根据用户的需求和环境动态调整其外观和行为的界面。
LLM驱动的自适应用户视图则能够根据用户的输入、上下文和偏好,实时调整界面的内容、布局和交互方式,从而提供更加个性化和高效的视觉体验。LLM为创建千人千面的自适应监控视图、构建多样化的人机交互体验,带来了新的可能性。
以提升用户体验、提高用户监控场景的灵活性为出发点,基于大语言模型的意图识别能力,捕捉用户的监控意图从而构建基于特定用户、特定监控视角的自适应故障场景监控能力。
自适应故障场景监控的整个构建过程可分为四个关键阶段:场景意图识别、意图可视化、监控数据渲染、场景固化管理。
图1:自适应场景监控构建历程
自适应故障场景监控架构设计参见图2,分为应用视图层、场景监控助手层、智能体管理层、MaaS基础大模型层等四个层级。通过从底层到顶层逐步增加场景监控元素,以支持用户自助构建场景监控的全过程。
图2:自适应场景监控架构体系
其中,场景监控助手层通过四个核心步骤的串接,实现用户监控意图到视图监控的引导式构建与持续复用,达成用户实现自助视图监控的功效。
• 场景意图识别:基于LLM的自然语言处理能力,深入解析用户的监控意图;通过与用户的多轮对话引导,不断细化应用场景,准确识别用户的监控需求,为构建自适应场景监控体系奠定基础。
• 意图可视化:结合识别的意图场景所需的呈现形式,匹配前端组件工具集,组合所需的前端插件生成目标视图。通过持续的对话引导,修改和更新视图,优化显示效果,设计出既符合需求又具吸引力的场景视图。
• 监控数据渲染:基于勾勒出的符合用户监控意图的展示视图,由大模型引导与数据服务进行桥接,向页面输送呈现所需的监控数据,实现监控数据与可视化呈现的一体化渲染,构建出符合监控意图与真实环境元素的场景监控视图。
• 场景固化管理:当渲染的一体化视图满足用户监控意图时,可将最终的监控视图固化保存,在后续的运维监控中重复使用,提升监控视图的管理效率和使用便捷性。
意图监控场景的构建,依赖前端组件工具集、监控数据工具集以及意图场景语料的支撑,通过前端插件集的多种组合构建监控视图,动态排版出用户的监控场景;基于对前端与监控数据的语义理解,由大模型动态调度串接,实现监控数据持续不断地注入到前端监控视图上,实现意图监控的灵活呈现效果。
结合告警监控流水窗、网络逻辑拓扑、GIS地理拓扑以及关键指标的时序趋势,理解用户的场景监控意图,构建属于用户独立视角的自适应故障场景监控。
一线网络运维工程师常常在繁复的监控视图中苦苦寻觅,却往往只能勉强找到符合个人工作需求的监控界面。他们缺乏一个高效的方式来迅速定制出与岗位职责完美匹配的监控视图。而借助大模型技术,监控人员可以根据特定意图,通过智能引导流程,迅速定制并生成多样化场景和多个维度的监控视图。
图3:场景意图引导
数据分析领域涉及的专业知识广泛,且具有一定的复杂性,对于未经专业训练的非研发岗位人员而言,理解数据的深层含义存在一定难度。通过运用前端技术中的先进插件,大型模型能够将抽象的数据转化为形象生动的图表,极大地提升了数据的可读性。这样的转换不仅使得多个维度的信息一目了然,而且有效降低了数据分析的入门门槛,让用户能够迅速洞察数据背后的意义,实现了一目了然的直观体验。
• 多维度监控视图:通过运用饼状图、柱状图、曲线图等前端展示工具,用户可以直观地掌握告警的分类统计、各类别所占比例以及具体数量等全局信息,实现数据的一目了然。
图4:场景监控可视化
• 告警流水窗视图:借助定制的告警流水窗视图,用户能够详细审视特定分类下的告警明细,从而在微观层面深入分析告警的具体状况,洞察问题所在。
图5:告警流水窗视图
为了方便用户使用,系统还整合了外部工具,将生成的监控视图进行持久化和标签化管理,用户只需一次生成,即可实现多次复用,大幅提高了监控工作的效率和便捷性。
图6:场景固化与复用
大模型时代的产品研发需要重新思考产品的交互视图,开发流程“从底层到顶层”都应该被彻底重构。本文探讨了如何通过智能体插件的方式构建自适应故障监控场景,依据原子化的基础视图插件构建千人千面的复杂监控场景,从而实现更加自然、智能和个性化的用户交互体验。
鉴于此次AI Native在故障场景监控领域的实践,所有产品经理和开发者都将被迫思考:基于逐渐壮硕的各类基础大模型,产品自身和开发者还能新增哪些能力或技能?这些能力要如何提供?通过插件、微调还是多个模型的组合?这些工作会远比原来视觉交互的静态调整要重要得多,也同样为产品的体验提升开辟了新的方向。
[1]《通信人工智能赋能自智网络》,2022
[2]《AIGC(GPT)赋能通信行业应用白皮书2.0》,2023
[3]《AI Native技术重构软件产品白皮书》,2024