随着ICT技术不断融合,网络功能虚拟化技术正深刻影响着未来的网络架构。本文介绍了NFV技术的概念、发展历程以及未来NFV技术的演进趋势,以期为关注网络与运营支撑的同仁提供借鉴、启发思路。
NFV是网络功能虚拟化(Network Function Virtualization)的简称。传统的网络功能通常由设备厂商开发专用的网络硬件设备配合相应的软件来实现。面对不断增长和变化的新业务需求,传统的网络架构在灵活性、可扩展性和新业务交付敏捷性上面临着巨大的挑战。
• 硬件实现
传统架构:各设备厂商专有硬件。硬件成本相对较高。
NFV架构:通用架构硬件(x86/ARM架构硬件等)。硬件成本相对较低。
• 网络扩展性
传统架构:增加或减少专有硬件设备,周期长。
NFV架构:通过在通用硬件平台上创建或释放VNF虚拟化实例来实现。周期短。
传统架构:专有硬件的规划、部署,涉及硬件设备调整。周期长,效率低。
NFV架构:通过虚拟化VNF实例的拉起、迁移、调整来实现。周期短,效率高。
• 新业务部署
传统架构:各设备厂商需开发/调整/部署新的硬件设备。TTM一般以月、年为周期。
NFV架构:通过可编程的方式,敏捷开发新的VNF软件并实例化来实现。TTM一般以天、周、月为周期。
• 运维复杂度
传统架构:需配备面向每个设备厂商的专有维护人员,不同厂商设备维护人员不能复用。维护人员需掌握CT专业知识,运维复杂度相对较高。
NFV架构:需配备通用架构硬件维护人员。维护人员需掌握通用IT专业知识,运维复杂度相对较低。
NFV架构由网络功能虚拟化基础设施、虚拟化网络功能和NFV管理与编排三个部分组成:
• 网络功能虚拟化基础设施(Network Functions Virtualization Infrastructure, NFVI)
NFVI是构建部署、管理和执行VNF的环境的所有硬件和软件组件的总和。NFV基础设施可以跨越多个地域。这些地域之间提供连接的网络也被视为NFVI的一部分。
• 虚拟化网络功能(Virtual Network Functions, VNF)
虚拟化的网络功能是通过虚拟化技术实现的传统网络设备功能。例如:5GC中的UDM、AMF、SMF;EPC中的MME、PGW、SGW;家庭网络中的CPE;以及传统网络中的交换机、防火墙等网络设备。
• 管理与编排(Management and orchestration, MANO)
MANO是实现VNF全生命周期管理的统一框架。包括面向NFVI资源管理的VIM功能、面向VNF实例管理的VNFM功能以及面向VNF创建、变更、调整等NS的资源统一编排功能。
NFV功能架构图
2012年10月,在德国达姆施塔特举行的“SDN and OpenFlow World Congress”会议上,ATT、BT、CenturyLink以及中国移动等全球13家运营商联合发布了NFV指导性白皮书,首次正式提出NFV概念。
2012年11月ETSI ISG NFV组织成立,开始全面推动NFV标准化工作。自此开启了运营商网络功能虚拟化进程,IT、CT融合趋势势不可挡。
ETSI ISG NFV以两年为一个周期开展工作。在2013至2014年(第一阶段)发表的文件被称为标准前研究,也被称为“第1版”标准。迄今为止,ETSI ISG NFV已经发布了6个版本。分别是R2(2015年)、R3(2017年)、R4(2019年)、R5(2021年)和R6(2023年)。
随着时间的推移,ETSI ISG NFV把重心从验证NFV的可行性,逐步转变为制定互操作标准。此后,ETSI ISG NFV发布了数十项NFV标准,总结概括如下:
• 第1版提出了NFV基础概念、技术优势、推动因素、面临挑战以及行动倡议;
• 第2版提供了第一套互操作实施方案,重点涵盖了根据NFV架构框架中指定的参考点,为NFV-MANO各功能块(VIM、VNFM和NFVO)之间以及与外部系统的互操作制定了各种功能模型和接口规范;
• 第3版从NFV网络运营视角增强了NFV框架;
• 第4版NFV开始明确支持容器化网元的管理编排,以更好地支持云原生部署和自动化;
• 第5版整合了各种生态系统,对NFV相关标准组织和开源社区产生了深远的影响,包括3GPP、TM Forum、LFN(例如Anuket、ONAP、Nephio等);
• 第6版聚焦于新的架构和基础设施,以扩展当前功能和增加新功能,包括:架构的演变和简化,新的基础设施,新的虚拟化形式等。
NFV技术不断发展,推动网络转型和技术变革,从最早的基于虚拟机的LTE虚拟化核心网,发展到基于容器虚拟化技术、具有基本自动化能力的5GC云化部署。NFV技术在5G网络的部署方面发挥了重要作用。3GPP定义的5G系统架构和5G核心网服务化架构设计就深受NFV影响。如今,业界用于5G核心网部署的几乎所有方案都包含基于ETSI NFV标准的虚拟化网络功能。
NFV技术自提出以来已有十年多的时间,它极大地推动了电信行业数字化转型和创新。随着客户业务需求的不断变化、新技术的持续演进以及市场环境的变化,NFV技术演进趋势如下:
(一)云原生
NFV概念提出之时,当时主流并成熟的虚拟化技术为虚拟机技术。因此,VNF主要是采用VM技术在NFV基础设施上实现。
与传统的基于硬件的方案相比,基于虚拟机的虚拟化技术优势明显,包括动态管理、隔离能力、安全和性能等方面的优势,这些因素在NFV部署中持续发挥着重要作用。尤其对于那些对MTTF有极高要求的电信网元而言,稳定成熟的虚拟机技术是优选方案。
因此,NFV社区在实现方案上选择通过内核虚拟机(Kernel-based Virtual Machine,KVM)、开放虚拟交换标准(Open vSwitch,OVS)、OpenStack等基于虚拟机的虚拟化技术来设计NFV架构、模型和接口等。
随着虚拟化技术不断迭代发展,在虚拟机技术日渐成熟后,操作系统容器虚拟化技术正逐步成为新一代云化应用开发和部署的事实标准。新一代云化应用的需求管理、应用开发、系统部署以及功能迭代等均遵循云原生架构。
云原生网络功能架构(CNF)是一种在容器内运行的网络功能实现架构,包括K8s生命周期管理、敏捷性、弹性和故障自愈能力等特点。容器技术具有体量小、上线快、跨平台、易维护等特点,提升资源利用率的同时还可以降低资源消耗。
未来NFV网络将更多地汲取互联网的基因,借鉴IT行业敏捷开发思想,基于CI/CD的DevOps集成开发模式,形成NFV的NS、VNF开发/测试/运行全程闭环自动化工具链,使能NFV网络功能与业务从开发至部署,更加敏捷、弹性与自动化,加速NFV向云原生架构演进。
(二)容器化部署
为了更好地部署和管理容器化网元,ETSI ISG NFV扩展了NFV-MANO功能,包括容器基础设施服务管理(Container Infrastructure Services Management,CISM)和容器集群管理(CIS Cluster Management,CCM)两个功能组件。ETSI ISG NFV 006中规定的NFV-MANO相关框架已包含这些新增组件。新增组件位于CaaS层。CaaS作为独立的容器资源层已引入NFV系统以支持网元容器化部署。
NFV要求业务与平台的解耦,在CaaS平台上具备高效构建应用的能力,其技术特性可有效满足NFV业务的动态、弹性、自愈、分布式部署能力,满足高可靠、高稳定性的要求。
(三)新虚拟化技术
以微虚拟机、Kata容器和Unikernel为代表的虚拟化技术演进,兼具了虚拟机和容器的优势,不仅能够很好地满足隔离、安全和性能需求,还能支持灵活部署、快速上线,以及资源有效利用。WebAssembly在灵活性及可移植性上更是优于容器,为边缘设备的虚拟化又增加了一项新的可选项。
随着新虚拟化技术在未来不断成熟,NFV技术将广泛地应用在核心网、边缘设备以及RAN侧等更多专业领域。
(四)声明式意图驱动的网络
NFV架构在未来将更加简化并将引入意图驱动的概念。意图驱动的声明式API在OSS系统与NFV的MANO之间发挥信息传递的作用。意图驱动的声明式API可以将网络管理需求以API的方式传递给NFV MANO,屏蔽了NFV MANO网络操作的复杂性,实现了异构厂商的互操作能力。
自智网络的高级阶段将是意图驱动的网络。通过意图理解、感知、分析、决策与执行来完成自智网络三个层级跨域端到端的闭环自动化,从而实现网络高阶自智。商务意图通过意图感知、意图理解转译为网络服务意图,网络服务意图以声明式API的方式转译给NFV MANO,由MANO进一步转译为资源意图,并逐层分解为面向多厂商异构NFVI网元全生命周期管理的各种具体操作行为,以实现对用户意图的感知、网络资源的自动配置以及网络控制策略的自动化部署。
(五)统一编排管理、智能运维
随着新的虚拟化技术的不断成熟,NFV将需要适应各种不同的虚拟化基础设施,面对不同的虚拟化实现技术,包括虚拟机、容器、单核/内核虚拟机等技术,来实现统一的虚拟化基础设施管理能力。
未来的NFV在具备异构多云管理平台能力的基础上,将逐步需要具备操作与维护能力,进一步研究容灾能力、冗余设计、预测管理、故障定位、跨层运营和资源池化等关键问题,从而构建高可靠(99.999%或更高可用性)的NFV系统。电信云还将利用站点可靠性工程、基础设施即代码(Infrastructure as Code)等新工具新方法,持续提高服务可靠性。同时基于AI技术的集成能力将提升NFV系统的智能化水平,实现NFV网络统一编排、智能运维。
(六)资源池扩展分布、全互联边缘部署
早期NFV架构更多地部署在各大运营商的核心网或中心DC里面。边缘计算的兴起要求NFV技术支持扩展分布和全互联的边缘部署模式。NFV技术的不断成熟与演进,DC资源池将呈现扩展分布的趋势,网络的边缘节点将逐步部署至边缘资源池中。随着接入侧RAN网元等虚拟化技术的成熟,RAN也将部署在边缘DC或接入DC中逐步实现其虚拟化进程。
就网络虚拟化的程度而言,核心网控制面虚拟化相比用户面虚拟化完成的更加充分。由于用户数据转发量与转发效率的双重要求,用户面虚拟化进程,往往成为整个网络设备虚拟化进度的瓶颈。随着DPDK、SR-IOV加速等技术的不断成熟与完善,用户面与接入侧也将逐步采用虚拟化、云原生技术实现,并获得与硬件转发设备同等的转发效能。核心、汇聚、接入侧虚拟化网元将呈现扩展分布、全互联边缘部署的趋势。
(七)智能算力管理能力
随着边缘计算、大数据、以及AI/ML技术成熟,需要考虑对GPU/NPU/DPU等智算资源的统一建模与度量,实现智算资源统一管理与调度。未来的NFV网络在基于通用算力虚拟化实现网络功能管理与编排的同时,将面对GPU/NPU/DPU等智算资源提供统一管理和调度能力,以满足智算业务编排管理的需求。智能算力将是NFV未来的重要演进方向之一。
早期的资源池算力部署多以通用CPU算力为主,GPU算力通常定位于媒体流编解码以及图像识别类操作。未来的算力在通用CPU基础上将引入GPU、DPU等智算资源,实现基础算力、AI算力、跨架构算力原生的统一管理能力,并提供分布式AI训练。支持网络算力内生,支持合理调配网、边、端侧算力资源,进而实现CPU+GPU+DPU多样算力的协同调度,以支持专网、边缘计算等多场景下的算力编排与调度需求。
以CPU+GPU+DPU为基础的云平台,结合算力池化、算力原生技术,支持TensorFlow、PyTorch等分布式AI框架,完成自动化最优分布式并行训练、异构混合分布式并行训练,为未来的智算应用提供通用的云化、细粒度池化、异构分布式并行的全栈底座能力,支持告警监控、故障诊断、故障网元隔离、边缘智能、多要素算力调度等多场景上层应用能力,为通信应用提供高可靠高容错的智能算力基础设施。
(八)AI内生
基于AI内生的下一代NFV网络通过意图感知可帮助MANO准确理解用户对于网络的业务需求(或商务意图),例如客户SLA,MANO根据产品与业务映射关系将其准确地转译为网络意图,再根据不同业务类型/等级对资源的供给要求,转译为资源意图。MANO依据资源意图可完成VNF实例的创建、激活、变更等各类资源实例操作,以达成NFV架构下的网络端到端闭环自动化。
例如,在网络规划和部署阶段,基于AI内生的容量规划和优化功能,可以精准实现规划容量,高效地利用NFV资源。在规划阶段,采用数字孪生技术,精确模拟辅助资源池的精准规划。在部署阶段,基于AI模型预测资源池的容量,自动扩展和缩减网络资源池容量,从而优化业务部署。在运营阶段,基于AI的NFV架构可自动评估和持续优化资源容量。
传统的网络故障监控通常在OSS层次实现。未来基于AI内生的NFV架构,利用机器学习和人工智能技术,NFV MANO将具备故障预测和预防能力,预先排除系统潜在故障,确保网络稳健度。系统运行过程中,NFV MANO可实时持续监测底层资源池状态。根据上报的事件和预测的业务实例问题,通过AI和知识图谱自动分析故障根因,自动界定和定位故障,隔离故障资源,最终快速恢复网络正常运转。
(九)安全内生
NFV技术是ICT融合的产物,因此,其面临的安全风险主要来自两个方面。第一,传统IT网络面临的安全风险,例如:DDOS攻击、僵木蠕、路由安全策略等。第二,NFV技术自身特点带来的新的安全风险。
NFV的架构包括:物理机层、虚拟化层、虚拟机层、VNF层以及NFV MANO。其中每一层均会引入新的安全风险。
以虚拟化层为例,由于Hypervisor对所有虚拟化网元均有极高的读写权限,因此,虚拟化层如果出现网络安全问题,将会极大地影响VNF的安全运行。
VNF层网元间通信如果不进行加密操作,网元间的通信数据很容易被监听。虚拟化网元的调试、监控功能很可能成为系统的后门入口。
传统的通信网络是专有硬件架构,网络安全主要采纳边界安全防护策略。网络设备与外部环境通常采用物理隔离方式,会将主要的防御功能投入到网络或系统物理边界的位置,例如采用安全区机制,设置跳板机等措施。它的防御前提是假设所有的攻击均来自系统外部,对内是完全可信的。
NFV架构采用虚拟化技术,打破了网络(或系统)的传统物理边界,一旦网路内部有一台主机被攻陷,攻击者就会通过在网络内部横向攻击将攻击面进一步扩大。传统的边界防御架构难以应对虚拟化环境面临的新挑战。因此,NFV架构的安全防护策略需要由边界防御向安全内生防御转变。
NFV的安全内生架构将引入可信计算的概念。可信计算的重要原则是进行身份认证。通过身份认证来确保网络实体、组件以及可执行代码均为合法可信。为保障网络通信安全,可以默认NS运行空间为零信任网络环境,通过严格的身份认证保障NS运行空间的安全可靠。同时,虚拟化网元间的数据通信应采用加密方式进行,以防止通信内容被监听/窃听。此外,还应建立针对异常行为的主动检测机制,通过异常行为特征及时发现并阻止影响网络安全的操作。
在上述纯软件安全防护的基础上,可逐步引入硬件安全防护技术,例如:如TPM(可信平台模块)、HSM(硬件安全模块)、HMEE(硬件辅助运行专属区域)等物理硬件安全防护技术,来多维度保障NFV网络安全运行。
(十)网络自智
国内运营商纷纷提出在2025年网络自智等级将达到L4级的愿景目标,全球运营商均在持续推动网络向高阶自治(L4/L5)演进。传统的网络运维工作正处于从L2/L3向L4/L5智能化演进(转型)的关键阶段。
5G网络通过引入NWDAF网元,推动人工智能技术与5G深度融合。基于AI分析与预测等多种网络模型,可完成网络规划与优化、预测网络告警、实现故障自愈、提高网络资源利用率,进而提升客户体验。
当今基于生成式AI的大模型能力越来越强,基于网络小模型结合生成式大模型为核心能力的智能化运维能力已成为未来网络的主要演进方向。
基于AI内生的NFV网络架构,将传统通信小模型与网络大模型有机结合,逐步实现网络潜在故障的预警预测、智能化的故障定界定位、智能化网络设备巡检、智能化波束赋形、智能化无线参数调优等。当业务量出现突变或网络设备发生故障时,基于AI内生的NFV网络可感知、可预测业务量变化,并依据业务量变化趋势,及时进行网络扩缩容等网络调整动作。基于网络亲和性、性能KPI等部署与运行策略智能化分配与调度网络资源,自动完成故障网元隔离,拉起VNF新实例,完成网元故障自愈,实现网络业务与运维意图(需求)的感知、分析、决策、执行的端到端闭环,逐步达到网络高度自智直至全自智的网络运维愿景目标。
(十一)绿色低碳
电信业务通常具备明显的潮汐效应。未来的NFV网络将基于AI内生能力,实现多阶段、多层次的绿色低碳演进。
多阶段指在网络规建维优的不同阶段,MANO根据对业务量的评估与预测,智能化动态激活、配置、调整NS实例,有效降低设备能耗。
AI内生的NFV网元能够在网络建设初期按照网络规划容量实例化NS,并按需对服务器硬件资源上电。在网络运行过程中,依据内生AI对历史话务量数据的分析以及网络扩容计划的感知,智能地对业务所需硬件服务器资源进行评估与预测,在业务量增加时,自动激活新的NS实例;在业务量下降时,自动去激活NS实例并收回分配的服务器资源,避免服务器空载,达到节能降耗的目的。
多层次指根据每天业务量的潮汐效应特征,通过对NF占用的CPU数量进行智能化调配,实现网络节能的目标。
AI内生的NFV网元可智能化感知网络业务潮汐时刻,在业务量峰值时,自动增加NF组件占用的CPU内核数量;在业务量波谷时,首先采用降低CPU主频的方式降低功耗,随着业务量的逐步下降进而采取CPU休眠、关核等操作,多阶段分层次达到网络绿色节能的目标。
伴随着网络向5G-A、6G的演进,为应对电信行业的数字化转型挑战,通过开放、合作、创新和标准化协作,伴随着云原生架构、AI内生、安全内生、智算通算融合编排以及声明式意图驱动网络等技术发展,NFV技术将会在下一代网络中继续发挥价值,为电信网络的自动化、智能化和可持续发展提供坚实的基础设施。
[1]ETSI White Paper No.54:《Evolving NFV towards the next decade》
[2]ETSI Network Functions Virtualisation - Introductory White Paper, October, 2012
[3]ETSI GS NFV SWA 001 V1.1.1 (2014-12): Network Functions Virtualisation (NFV); Virtual Network Functions Architecture
[4]ETSI GS NFV IFA 011 V2.1.1 (2016-10): Network Functions Virtualisation (NFV); Management and Orchestration; VNF Packaging Specification
[5]IMT-2020 (5G)推进组 《5G网络架构设计白皮书》