网络数字地图是物理网络世界的数字孪生,是全新一代网络运维技术。它基于数字孪生理念构建企业数字化智能大脑,实现云、网、端、应用及用户的统一智能管理,帮助客户从传统的静态拓扑运维模式切换到动态高清的电子地图运维模式,即通过网络数字地图来直观感知网络,大大提高网络运维效率。
数字化时代到来之前,人类的交通出行主要依靠个人知识和经验来识别交通路线,无法直观而及时的感知路况的变化,交通出行也经常绕很多弯路。而电子地图的出现,改变了人类的出行方式,传统静止不动的世界,变成一个真实的、动态的和实时可感知的数字世界。人类通过一张掌上数字地图,实时获取真实世界中最新数据,了解交通拥堵、封路信息等,提升出行体验。
企业正加速向数字化、智能化转型,网络联接作为数字化基础设施的底座,在推动行业数字化转型中发挥着越来越重要的作用。伴随着企业数字化的推进,企业业务迅猛发展,网络规模和复杂度剧增,但企业的运维人力没有显著增长,这就意味着要用少量的人去做更多的事情。因此,网络运维的痛点更加凸显出来,没有一张统一的视图感知企业网络的健康状态,用户网络体验差,故障投诉多,异常恢复的效率低等,远远跟不上企业数字化转型的步伐。
不同于传统运维的静态网络拓扑图,网络数字地图拥有实时、动态、高清的优势。它通过高速数据采集、AI和大数据计算、路由仿真和验证算法等关键技术,实现多维可视、路径导航、搜索定位、确定性应用体验保障等功能。网络数字地图可提供网络质量实时可视、定界定位和自愈能力,帮助客户从传统的静态拓扑运维模式切换到动态高清电子地图运维模式,即通过网络数字地图来直观感知网络,大大提高网络运维效率。
类比于交通导航地图,网络数字地图是物理网络世界的数字孪生,以体验为中心提供可视化、易交互的数字化智能管理平台,通过与交通导航地图的类比可以更好地理解网络数字地图的业务场景。
图一 交通导航地图与网络数字地图对比
表1 交通导航地图与网络数字地图对比
在园区网络,通过网络数字地图可以精准透视网络层、用户终端层、应用体验层三个层次的信息,一图洞悉园区的人、事、物及其与网络的关系,帮助用户解决网络状态不可视,业务体验难保障,网络故障难定位等问题。
图二 网络数字地图在园区网络的应用
三层状态感知
园区网络日益庞大,设备数量、终端数量急剧增长,如果不能及时感知网络的详细状态,则网络的例行维护将会变得更加困难,运维人员的工作量和压力都会成倍增加。园区网络数字地图是园区网络的数字孪生,能够实时感知网络层、用户终端层、应用体验层三个层次的状态信息,当设备故障、应用或者用户体验劣化的时候,数字地图能够主动感知。
分钟级AI定位
园区网络的无线接入场景越来越多,无线用户接入失败、网络中断的问题时有发生;另外,处理无线网络故障的技术要求高,问题定位难度大,缺少修复手段,如果不及时感知和处理,很容易引发用户不满甚至是投诉。园区网络数字地图基于用户旅程实现用户状态的可视化,在时间和空间两个维度上呈现用户的实时体验状态,当用户体验发生异常的时候及时给出提示信息,例如在什么时刻发生了异常,发生异常的时候用户在什么位置,接入的哪个AP等等。
一站式体验保障
园区网络中音视频业务快速增长,但是传统的音视频业务的体验保障一直都是人工保障,需要逐台设备上做大量繁琐的配置步骤,难以及时响应,体验的快速保障需求日益迫切。园区网络数字地图可以实现体验保障一键下发,用户只需要选择保障对象(VIP或者应用),即可自动生成配置,一键下发配置,大大提升体验保障的效率。
网络数字地图基于数据接入层、业务中台及业务应用层三层构建。
业务应用层
业务应用层是网络数字地图围绕拓扑可视为客户提供的核心功能,支撑客户的日常运维和业务变更。
业务中台
业务中台是网络数字地图的关键技术模块,承载应用层各功能的实现或前置依赖。其中,数字孪生引擎负责网络数字地图的数据治理和数字化建模,是网络数字地图的核心底座之一;网络仿真负责网络的仿真建模、算路和断点分析,是网络拓扑导航的技术基石。
数据接入层
数据接入层统一管理网络数字地图服务的各类数据源、采集驱动,为网络数字地图系统提供数据接入服务。
图三 网络数字地图业务架构
传统网络管理系统采用SNMP协议来获取设备指标,但它有明显的缺陷,无法满足“以体验为中心”运维理念的需求。首先,SNMP使用“网管查询-设备响应”的拉模式(Pull Mode)采集数据,数据采集器与设备之间是一问一答的交互,一次查询对应一次响应,设备压力大,大量数据查询时效率低。其次,SNMP使用刚性数据结构,完成一次有效采集需要多次数据请求,基于这样的设计机制,SNMP的数据查询的典型频率是5分钟,如果查询频率过快会严重影响设备的正常业务。网络数字地图采用Telemetry技术作为从设备上远程高速采集数据的网络技术,设备通过推模式(Push Mode)主动向采集器上送信息,提供更实时、更高速、更精确的网络感知功能。
图四 网络数字地图通过Telemetry采集海量数据
具体来说,Telemetry按照YANG模型组织数据,利用GPB (Google Protocol Buffer)格式编码,并通过GRPC(Google Remote Procedure Call Protocol)协议传输数据,使得数据获取更高效,智能对接更便捷。采用Telemetry技术进行海量数据采集,比SNMP效率高20倍以上,可以实现10秒级的数据采集频率,同时有如下几个方面的优势。
采用推模式主动推送数据,降低设备压力。
周期性推送数据,避免网络延时造成数据不准确。
可以查看大量网络节点,弥补传统方式的不足。
随着业务云化、终端无线化和物联网等带来业务模型的变化,使得网络节点,业务故障点、故障原因也成倍增长。传统的“以设备为中心”、“救火式”运维已无法满足数字化时代对故障响应的需求,工程师人工分析的手段已无法胜任对海量数据进行分析。
让机器基于故障特征库在秒级采集的大数据仓库中自动关联分析、挖掘,并结合专家经验识别异常;同时,海量大数据的汇集也给通过机器学习从海量数据中发现未知关联和因果关系,创造了条件。
图五 网络数字地图大数据建模分析示意
机器学习通过对海量数据建模分析并持续学习,从而识别出复杂的业务模式、构建动态基线预测数据趋势、挖掘未知的关联关系,从而识别潜在故障和定位根因。
网络数字地图将采集到的数据进行智能分析以后,通过多个图层、多个维度的可视化形式呈现给用户,帮助用户在数字世界中直观感知网络的状态。
图六 数字地图多维呈现
底图是一张GIS地图,站点及网络节点的位置在GIS地图上统一呈现,支持xyz格式瓦片、OGC标准的WMS/WMTS服务等多种在线以及自定义地图加载,支持离线加载。通过设置站点及网元节点的GIS坐标,自动按GIS坐标布局站点及网络节点的位置,支持多级拓扑缩放,支持自动拓扑布局。基于网络拓扑呈现网元、链路等状态信息,在网络之上呈现业务及应用信息、如路径导航、端到端业务可视等。
传统的网络管理系统基于LLDP链路协议还原网络拓扑,但是这种方式无法适应异构网络的复杂环境,当网络中存在不支持LLDP链路协议的老设备或者第三方厂商设备时,或者考虑安全合规等因素未开启LLDP链路协议的时候,则无法准确识别和还原网络拓扑。
图七 基于AI的网络拓扑智能还原
网络数字地图根据设备配置、ARP表、MAC表、端口流量特征、LLDP 这5类数据,采用多模态表征AI推理技术,精准识别和还原网络拓扑,全网拓扑还原准确性大大提高。
网络数字地图基于SAC(Smart Application Control,智能应用控制)完成应用协议的识别与分类,结合iPCA2.0技术进行应用体验的分析及故障定位。iPCA2.0采用特征分组测量法来实现丢包统计。所谓特征分组测量法是指在源端报文入口处,对业务报文头中指定染色位进行周期性的标识(置位、复位),基于统计周期测量网络的丢包数据。
图八 iPCA随流检测与故障定位
以常见的丢包故障为例,在同一段时间内,上图中的“2”口统计到出去的IP报文数为1000个,“3”口统计到的进入的报文数为900个,则经过计算可以确定在“ACH2”这条链路上发生了丢包,且丢包率达到了10%,根据此分析结果,运维人员对“ACH2”进行维修即可。
企业网络内应用类型众多,用户位置多变,音视频业务快速增长,应用和VIP体验的快速保障得诉求日益迫切。传统的业务保障需要每台设备逐一配置,配置步骤繁琐,而且依赖于专家经验,人力成本高,难以及时响应业务诉求。
网络数字地图以可视化界面为入口,一键设置重保应用和VIP用户,系统根据业务意图自动生成业务配置,一键批量下发,大大提升业务重保的配置效率和准确性。
图九 应用和VIP用户体验保障
对于重要应用和VIP用户,系统会预留专门的资源,例如无线AP为VIP用户预留OFDMA频谱资源,音视频业务优先调度等,这样就为重要应用和VIP用户设置了专属快车道,可以有效避免因蜂群式流量移动、音视频流量突发引起的会议卡顿及VIP用户体验不佳等问题。