IDC设备管理和应用管理是一项复杂且具有挑战的任务,主要需要面临以下难点:
• 复杂的网络拓扑
• 多样的异构设备
• 难以统一运维和监控
• 较低的资源利用率
阿里云容器服务Edge版(简称ACK Edge)提供了一套分布式云原生平台,将标准K8S控制面托管在云端,可将分布在一个或多个IDC的设备统一接入到一个集群中。
具有以下优势:
• 统一的容器网络平面:通过容器网络插件提供统一的应用网络平面
• 更高的资源利用率:通过容器化平台的调度能力根据应用需求动态分配负载
• 统一的管理界面:通过APIServer实现应用的部署、监控、运维
• 弹性扩展:通过云端节点池实现ECS、ECI等弹性计算实例扩容
容器网络概述
在构建分布式容器化平台过程中,网络连接的复杂性和灵活性需求不断增加,CNI(Container Network Interface)插件是构建高效、安全、灵活的容器网络的关键。常见的CNI插件包括了Calico、Flannel、Cilium等。
在分布式云容器平台中,常见的容器网络插件采用了Overlay模式:是在现有的物理网络之上构建的虚拟网络,通过隧道协议(如VXLAN、Wireguard等)将数据包封装在网络隧道中,无需对底层物理网络进行复杂配置,同时,由于复杂的隧道协议封装,降低了容器网络通信效率和吞吐量,导致了容器网络平面与物理网络平面分层、可配置性差等缺点。
ACK Edge高效容器网络插件
ACK Edge对分布式云场景提供的一种Underlay容器网络方案Terway Edge版,直接通过物理路由和交换机设备进行容器间通信,不对数据包进行封装,大大减少开销、提升吞吐量,在分布式云场景中支持高效、可扩展、稳定的容器网络通信需求,如图:
在云边协同架构下一个Kubernetes容器集群可以分为两个部分,云端专有网络VPC和边缘侧IDC。
在云端VPC中,每个Pod容器会被分配一个VPC内网IP地址,容器间通信通过虚拟交换机以及虚拟路由表实现。
在边缘IDC中,每个Pod容器会被分配一个虚拟IP地址,并且在节点上配置好路由配置,容器间通信通过节点的主机网络栈以及交换机实现。此外Terway Edge插件支持在一个局域网内选择部分节点作为路由发布者,通过BGP协议将容器路由发布给交换机,支持复杂网络拓扑下的容器间通信。
相比于一般Overlay容器网络的优势:
• 网络通信效率、吞吐量提升15%以上
• 支持业务更加平滑地从传统架构迁移为云原生架构
• 无缝对接更加丰富的云产品,例如ECI、负载均衡等
• 集群内外网络通信更加自由
落地案例
下面我们结合真实的客户案例,如何利用Terway Edge的网络能力。
某AI公司-AI业务容器化
该客户主营AI模型训练和推理业务,采用了ACK Edge将云上ECS以及自有的IDC统一管理,云上ECS主要负责一些推理业务、AI训练的控制面组件,云下IDC主要负责一些AI训练任务。
在网络层面有以下需求:
• AI训练需要高效的网络传输需求
• AI推理业务依赖AI套件、负载均衡等云产品
• 客户侧开发人员的设备需要访问集群内Pod容器,进行一些运维、调试、观测等操作
通过采用Terway Edge网络插件客户获得了以下收益:
• Terway Edge插件使得容器网络与主机网络在一个网络平面,客户业务从传统的裸机训练迁移到容器化更加平滑,无缝对接各类云产品
• 保障了客户侧开发人员设备可以直接操作集群内Pod容器,提升研发效率
/ END /