智算中心超大规模网络技术解析

科技 2024-10-20 23:06 广东

超大规模网络技术是智算中心网络的重要组成部分，旨在解决智算中心内节点数量极其庞大、互联需求复杂、数据传输要求极高等问题。引入新型拓扑（如Dragonfly直连拓扑）以支持更大规模的集群，提升网络带宽利用率和低延时能力。

1. 新型拓扑结构

当前智算中心网络通常采用 CLOS 网络架构，这种架构具有较强的通用性，但在面对超大规模场景时，其低时延和低成本的需求无法完全满足。因此，业界针对这个问题开发了新的拓扑设计。

CLOS 网络架构：CLOS 拓扑是一种多级分层的网络结构，它通过多级交换机相互连接，以提供高带宽和多路径的网络通信能力。虽然它适合一般的计算中心和中小规模网络，但在超大规模集群中，CLOS 架构面临跳数较多、延迟较高的问题。
Dragonfly 直连拓扑：Dragonfly 是一种新型的超大规模直连拓扑结构，它减少了网络的直径，并优化了路径跳数。例如：

Dragonfly 可以实现最多 27万节点 的连接，规模是 3 级 CLOS 组网的四倍。
在 10 万节点规模的集群中，使用 Dragonfly 直连拓扑，可以将 端到端的跳数 从 CLOS 架构的 7 跳减少到 3 跳，交换机台数减少了 40%，极大降低了系统的复杂性和成本。

2. 高效能 IPv6 演进

随着 AI 和机器学习等技术的发展，智算中心的节点数量和 IP 地址需求迅速增加。尤其在智能算力集群中，节点的虚拟化比例较高，这要求网络必须具备海量 IP 地址分配能力，而传统的 IPv4 地址池已无法满足这种需求。

IPv6 的引入：IPv6 可以提供巨量的 IP 地址池，支持智算中心内的各种智能计算设备进行互联。
IPv6 Over IPv6 的 VxLAN 隧道技术：VxLAN（虚拟扩展局域网）通过隧道技术在不同的子网中提供 IP 地址互通能力。智算中心中，通常需要大量的 IP 地址分配，VxLAN 技术可以有效解决跨多租户和跨 TOR（Top-of-Rack）之间的 IP 通信问题。

不过，VxLAN 在 IPv6 网络中的报文封装成本较高，双层 IPv6 头部会增加封装负担，导致报文的转发能效下降。特别是对于小包数据的处理，这种封装开销非常显著。

优化方案：为了提升网络效率，白皮书提出了一种 高能效 IPv6 转发 方案，避免了对原始 IPv6 报文进行冗余封装，仅通过 IPv6 扩展头的方式支持业务需求，实现了高效的 IPv6 转发。这种方式能显著提高智算中心的网络转发性能，同时支持多租户隔离、跨智算中心互通、微分段及业务链能力。

3. 智算中心间的网络连接

随着国家“东数西算”战略的推进，多个智算中心之间的协同计算和分布式算力需求日益增加，跨中心协同成为高效算力利用的关键。这种跨智算中心的网络连接提出了超高的带宽利用率、低丢包率和长距离传输时延控制的要求。

带宽和丢包控制：跨智算中心的网络连接通常需要支持上百 Gbps 甚至到 Tbps 级别的链路，带宽利用效率至关重要。此外，丢包率越低，传输效率越高，因此新的传输层协议和拥塞控制算法被引入以提升带宽利用率和降低丢包率。

TCP BBR 算法：TCP BBR（Bottleneck Bandwidth and Round-trip time）算法可以提高带宽利用率，但丢包率较高。
RDMA 协议的硬件卸载：远程直接数据访问（RDMA）技术被用来应对超长距离传输中的高性能需求，通过硬件卸载的方式可以实现超长距传输的高效性能，确保吞吐能力接近链路带宽。

挑战与技术改进：跨智算中心网络面临的主要问题包括：大带宽时延积（BDP）带来的拥塞问题，超长光纤传输的错包问题，以及高带宽利用的丢包重传挑战。这需要网络设备具备更强的缓存能力和无损流控能力。

全光网络直连 和 广域确定性承载网络 是当前解决智算中心间超长距网络的研究方向，特别是通过引入 空芯光纤，能够大幅降低传输时延和提高确定性，为低延时和高确定性的跨智算中心互联提供了支持。

4. 池化总线级互联

智算中心的核心是算力资源的池化管理，CPU、GPU、内存、存储等各种计算资源通过网络总线级别互联。这种资源池化的网络架构要求智算中心网络具有极高的带宽、低时延和灵活的资源调度能力。网络的性能不仅是计算能力的瓶颈之一，同时也是提升智算中心整体算力的关键。

端网协同：通过智能网卡（SmartNIC）和网络设备协同工作，智算中心实现了低时延和高吞吐量的网络连接。例如，智能网卡可以卸载网络协议栈，从而提升网络性能和规模。
网络态势感知和动态路径调整：通过优化拥塞控制算法、端到端带内遥测等技术，智算中心网络可以实时感知网络负载变化，自动调整路由策略，确保计算资源的高效利用和数据流的高效传输。

http://mp.weixin.qq.com/s?__biz=MzU5OTA3ODUyMA==&mid=2247487952&idx=1&sn=558d59182d47a40eb0f556afe2bb87b1

初越就业班

专注于为大学生、职场人员提供针对IT岗位设置的突击就业课程，包括培训、实操、考证和就业。

最新文章

网络故障处理思路及处理案例分享

城域网网络设备安全与网管部署案例

城域网IGP部署案例分享

5G 组网的8 种方式有什么区别全分析

一文了解运营商网络云现网架构

智算中心超高性能网络关键技术分享

智算中心超大规模网络技术解析

如何设置让WIFI更安全

贸易公司通过NB-IOT跟踪产品方案分享

Wi-Fi速率影响因素

为什么要基于OXC全光网的算力网络

无线云网融合智慧服务总结

什么是原生云？网络原生云有哪些好处？

2.4G Wi-Fi与5G Wi-Fi如何选择?Wi-Fi信号强弱与什么有关？

快速理解WIFI与WLAN的相同与不同

快速学习web渗透的2个工具BurpSuit和Phpstudy

一文理解算力网络

网络设备安全加固实践

网工轻松学习人工智能基本原理

MEC：5G时代的边缘智能与低延迟网络

5G空口关键技术-5G频谱介绍

运营商有线宽带VLAN规划方案分析

5G网络承载网架构

如何建立一个面向AI大模型的智能计算网络

利用4G网络开通集团专线业务

5G无线网架构-基站功能架构，无线站点部署

基于服务的架构,5G核心网与4G有哪些区别？

算力网络对网络的要求有哪些

IP城域网集团客户专线冗余方案（BFD+VRRP部署案例分享）

5G网络关键技术-提高效率

5G网络关键技术-增强覆盖技术

5G核心网概述，网络架构的演进

运营商7750SR受攻击后Ping丢包严重处理过程

5G站点解决方案和改造设计

大型教育网络设计分享

5G无线小区参数设计

做网络工程验收测试方案分享

5G Massive MIMO关键技术与部署

华为网络设备扩容单板操作分享

5G空口帧结构、物理信道、物理层处理过程

5G上下行解耦原理，5G空口技术，5G在车联网和远程医疗中的应用

【HCIP&软考网工】交换实验6：单臂路由和多层交换

5G网络架构介绍，5G基本原理

【HCIP&软考网工】交换实验5：Eth-Trunk

cmnet路由策略（BGP+ISIS）

【HCIP&软考网工】交换实验4：MSTP（多实例生成树！

cmnet网络介绍

【软考网工】交换实验3：RSTP（快速生成树）的配置与优化

传统架构和云上架构web服务有什么区别？

【软考网工】交换实验2：STP的配置与优化

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉