算力网络基础知识全解(收藏版)

科技   2024-11-14 07:49   四川  

数据经济的发展将推动海量数据产生,数据处理需要云、边、端协同的强大算力和广泛覆盖的网络连接。算力网络就是一种在云、边、端之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施。

下载链接:

《算力网络技术白皮书及报告合集》

《2030技术洞察报告合集》

1、计算2030(2024版) 2、数据中心2030(2024版) 3、计算2030(2024版)

《算力网络技术专题合集》

《智算数据中心基础设施技术合集》

存算一体:算力网络创新发展
中国操作系统技术产业发展报告(2023年)

确定性算力网络白皮书

云计算中的网络基础知识

智能化宽带网络网关(iBNG)技术白皮书

中国交换机行业短报告

交换机:算力基座迎来新机遇(2023)

《中国联通云技术实践及白皮书合集》

1、【中国联通】电信网路由安全白皮书 2、【中国联通】机密计算共享数据价值白皮书 3、【中国联通】企业数据跨境合规与技术应用白皮书 4、【中国联通】软件供应链安全治理实践指南白皮书 5、【中国联通】云原生安全威胁分析与能力建设白皮书 6、【中国联通】中国联通5G网络商用密码应用白皮书


什么是算力?

算力是计算能力

算力的定义
随着国家大力发展数字基础设施,算力的提升和普惠变得越来越重要,它注定会在人们的视线中占据很重要的一席。那么算力是什么呢?
所谓算力,简而言之就是设备的计算能力(Computing Power)。小至手机、PC,大到超级计算机,没有算力就没有各种软硬件的正常应用。以PC而言,搭载的CPU、显卡、内存配置越高,一般来说算力就越高。

对于算力网络来说,一张具有超大带宽、超低时延、海量连接、多业务承载的高品质网络是关键。

那么,如何打造一张为算力连接提供高品质服务的网络呢?这里必须要关注到算力网络的几个关键特征

1.弹性:算力网络的流量特征与互联网的流量特征不完全相同,对于弹性带宽的需求更加突出。例如,在气象的计算场景中,气象中心每天需要计算1~2次,每次计算2小时,在这2个小时内需要非常大的带宽。那么,对于气象中心来说,更适合的是带宽可调整、时长可定制的弹性连接服务。

2.敏捷:算力的泛在和分散的分布,要求算力网络必须具备泛在算力敏捷接入的能力。企业客户或者个人用户接入算力网络来获取计算服务,并不需要关心网络中的算力资源和分布情况,只关心算力是否能够敏捷地获取到

3.无损:算力由网络来实现互联,网络中的每个丢包,甚至在云数据中心内部的分布式计算过程中的丢包,都会造成算力计算效率的下降。据测算,0.1%丢包就会造成50%的算力损失。因此,数据中心内部、数据中心之间的无损传输成为算力网络的一个关键特征。

4.安全:数据是计算的核心要素,也是宝贵资产,需要安全输送到算力节点,并安全返回计算结果。安全是算力网络使能到各行各业的一个关键的特征,包括数据安全存储、数据安全加密、算力租户之间数据的安全隔离、外部攻击和数据泄露防护、终端安全接入等。

5.感知:算力网络中存在海量的应用(算力的需求方)连接,如何为不同的应用提供差异化的SLA保障,又如何为其中重要的应用提供性能的检测和看护,也是算力网络需要考虑的一个关键问题。感知,就是说网络一方面要能够“感知应用”,另一方面还要能够“感知体验”。综合起来,形成算力网络“应用体验感知”能力。        

6.可视:在算力网络中,需要建立一张网络数字地图,通过应用、算力、网络三者的映射关系和图层建模,形成算(数字世界)和网(物理世界)高效关系映射。网络数字地图对于网络全景进行了动态绘制和动态刷新,可以实现网络拓扑清晰可视、网络路径透明追踪、故障传播关联溯源,以及在算力网络中基于网络、应用、算力关系映射的应用一键导航。

通过哪些技术来匹配网络的这些关键特征呢?
IPv6+是基于IPv6的网络创新体系,是面向 5G 和云时代的智能 IP 网络,可以满足算力网络灵活组网、优化用户体验按需服务等需求。体系中的SRv6、BIERv6、网络切片、确定性IP网络DetNet、随流检测IFIT、应用感知APN6、业务功能链SFC、智能无损等创新技术,可以打造云、边、端全连接的智能IP算力网络,把算力源源不断地输送给万物。
当前,CCSA (中国通信标准化协会)TC3 正在开展算力网络需求与架构的研究工作,其思路是通过网络、存储、算力等多维度资源的统一管理和协同调度,实现连接和算力在网络的全局优化,技术实现上可分为集中式方案、分布式方案、及混合式方案等多种技术路线
除基于数据中心 SDN 集中调度的方案,还可基于电信运营商承载网分布式控制能力,结合承载网网元自身控制协议扩展,复用现有 IP 网络控制平面分布式协议的方式实现算力信息的分发基于算力寻址的路由,同时综合考虑实时的网络和计算资源状况,将不同的应用调度到合适的计算节点处理。如图所示
         
算力的衡量
算力的单位,是衡量算力强弱的指标和基准,当前存在多种不同的衡量方法。常见的包括MIPS(每秒钟执行的百万指令数,Million Instructions Per Second)、DMIPS(Dhrystone每秒钟执行的百万指令数,Dhrystone Million Instructions executed Per Second)、OPS(每秒操作次数,Operations Per Second)、FLOPS(每秒浮点运算次数,Floating-point Operations Per Second)、Hash/s(每秒哈希运算次数,Hash Per Second)等。
其中,FLOPS单位一直被视为衡量计算机运算速度的主要指标之一。从量级来看,PC的算力为GFLOPS级别;中国超级计算机神威“太湖之光”的算力为93.015PFLOPS;鹏程实验室的鹏程云脑II(以华为Atlas 900集群为底座)拥有1000PFLOPS的强大算力,相当于数千万甚至上亿台PC的集合。
再举一个Hash/s单位的例子,数字货币比特币挖矿(获取比特币)的矿机每秒钟能做多少次哈希碰撞,就代表这台挖矿机的算力。矿工的矿池,也就是他拥有的所有矿机的算力占比特币全网总算力(所有参与挖矿的矿机算力总和)的比率,代表着他在挖矿竞争中能获胜的概率。PC的算力为GHash/s级别,而目前比特币全网总算力已达到200EHash/s(每日均在波动),按这个比率,现在PC挖矿的成功概率为百亿分之一。
算力的分类
算力按照应用领域,可以分成两大类:
  • 通用算力:计算量小;常规应用,只消耗少量算力。
  • HPC(高性能计算,High-performance computing)算力:计算量大;一个任务,要调用巨多计算资源。HPC是一个计算机集群系统,它通过各种互联技术将多个计算机系统连接在一起,利用所有被连接系统的综合计算能力来处理大型计算问题,所以又通常被称为高性能计算集群。

HPC和通用算力
其中,HPC算力按照应用领域又可以细分为三类:科学计算类、工程计算类、智能计算类等。
由于人类将步入智能世界,人工智能算力需求大量增加,并且人工智能也会参与到科学计算和工程计算中。所以,一般情况下,我们也可以简单地将算力分为:通用算力和人工智能算力两类。

算力为什么重要?

智能世界三要素
在智能世界中,智能是知识和智力的总和,智能翻译到数字世界就是“数据+算力+算法”。

智能世界三要素
其中算法需要通过科学家研究实现,海量数据来自于各行各业的人和物,数据的处理需要大量算力,算力是智能的基础平台,由大量计算设备组成。
算力需求高涨
据华为发布的《计算2030(2024版)》预测,2030年人类将进入YB数据时代,全球数据每年新增1YB。通用算力将增长10倍到3.3ZFLOPS 、人工智能算力将增长500倍超过100ZFLOPS。100ZFLOPS的算力是什么概念,1023量级,相当于一百万个中国超级计算机神威“太湖之光”的算力总和。

为什么算力需要连成网络?

算力分布更加泛在

算力基础设施从云向算泛在演进,其位置的分布从中心向边缘和端侧泛在延伸,将出现云、边、端三级算力架构。

云、边、端三级算力架构
中心,指的是云计算的数据中心。云计算是一种基于网络“云”的超级计算模式,在远程的数据中心里,成千上万台计算机和服务器联结成一片计算云。各行各业、个人,都通过网络接入云计算数据中心,按自己的需求进行数据存储和数据计算。云计算按部署类型可以分为公有云、私有云(如通信云)和混合云,不同的云对应的是不同的用户群体。
边缘,指的是多接入边缘计算,其概念是相对于云计算而言的,云计算的处理方式是将所有数据上传至计算资源集中的云端数据中心处理,任何访问请求都必须上送云端处理。因此,在面对物联网数据量爆发的时候,传统云计算弊端逐渐凸显:
  • 无法满足海量数据处理诉求:随着互联网与各个行业的融合,特别是在物联网技术普及后,计算需求出现爆发式增长,传统云计算架构将不能满足如此庞大的计算需求。
  • 无法满足实时数据处理诉求:物联网数据被终端采集后要先传送至云计算中心,再通过集群计算后返回结果,这必然出现较长的响应时间,但一些新兴的应用场景如无人驾驶、智慧矿山等,对响应时间有极高要求,依赖传统云计算并不现实。
边缘计算的出现,可在一定程度上解决传统云计算遇到的这些问题。物联终端设备产生的数据不需要再传送至遥远的云数据中心处理,而是就近在网络边缘侧完成数据分析和处理,更加高效和安全。当然,边缘算力的形式也可以是“云”,即所谓的区域云、边缘云。

边缘计算
未来,边缘算力将大于中心算力。
而端侧,指的是终端,即PC、手机、智慧电视,甚至是家庭的机顶盒、智能水电表等一切具备联网和计算能力的设备。物联网时代,将会有海量终端接入到网络中,汇集这些社会闲散设备的存量算力,就是算力共享。也就是从这个意义上来说,算力是泛在的。

算力需要网络调度

因为算力出现云、边、端三级算力架构的泛在演进趋势,算力的分布将不再集中在数据中心,而是广泛地分布在边缘或者端侧的任何位置。
如果所有的这些算力节点之间,没有通过网络互连,这些算力资源是没有办法被共享、被调度、被使用、被协同的。
《中国联通算力网络白皮书中国联通云技术实践及白皮书合集》中也提到,实现云、边、端算力的高效调度,需要算力网络。具体来说,高效算力必须具备三个关键要素,才能实现数据与算力的高吞吐、敏捷连接和均衡随选。而这三个要素,都必须由网络来支撑。
  • 专业:聚焦专用场景,用更低的功耗和成本完成更多的计算量。例如,在边缘对视频进行高数据吞吐量的分析和处理。
  • 弹性:数据弹性处理,网络为数据需求到算力资源之间提供敏捷的连接建立和调整能力。
  • 协同:资源充分利用,从处理器内部多个核之间的协作,到数据中心内部多台服务器之间的“算力均衡”,再到整个网络边缘的“随选算力”。

高效算力的三个要素

到底什么是算力网络?

算力网络的定义

互联网、大数据、云计算、人工智能、区块链等技术创新,加速了数字经济的发展。数据经济的发展将推动海量数据产生,数据处理需要云、边、端协同的强大算力和广泛覆盖的网络连接。
算力网络就是一种根据业务需求,在云、边、端之间按需分配和灵活调度计算资源、存储资源以及网络资源的新型信息基础设施。算力网络的本质是一种算力资源服务,未来企业客户或者个人用户不仅需要网络和云,也需要灵活的把计算任务调度到合适的地方。
网络的核心价值是提高效率,电话网提高了人类沟通的效率,互联网提高了人类协同工作的效率,算力网络的出现是为了提高云、边、端三级计算的协同工作效率。区别是传统网络直接为人类服务,算力网络直接为智能机器服务,并通过智能机器间接为人类服务。
算力网络构建了海量数据、高效算力、泛在智能之间的互联网络,为每个人、每个家庭、每个组织带来智能。

构建数据、算力、智能之间的互联网络
华为发布的《计算2030(2024版)》也提到了类似的观点:算力网络代表了从“面向人的认知”向“面向机器认知”(人工智能)的网络设计理念的重要变化,联接海量用户数据与多级算力服务。
算力网络的核心思想是通过新型网络技术将地理分布的算力中心节点连接起来,动态实时感知算力资源状态,进而统筹分配和调度计算任务,传输数据,构成全局范围内感知、分配、调度算力的网络,在此基础上汇聚和共享算力、数据、应用资源。
算力中心呈现多层次,多管理域的布局。不同的算力中心间存在巨大的差异性,从资源的角度看,部署的应用类型、保存的数据集、算力的体系结构可能不同;从管理的角度看,管理策略、计费标准、碳排放标准可能不同。因此,算力网络的建设须面对不同算力中心间的高效协同,算力、数据、应用可信交易与管理机制设计,缺乏一体化标准等挑战,最终构建成为开放的、高资源利用率、高能效的计算基础设施。

算力一张网
算力网络看似是一张网,联接了所有的计算节点,实际是将所有计算节点的算力汇集到一个算力池中,实现算力的“一点接入,即取即用”。

算力网络的功能

算力网络曾经出现CAN(算力感知网络)、CFN(算力网络)、CFN(计算优先网络)、CPN(算力网络)等类似的不同叫法。
不管怎么称呼算力网络这个新概念,都是描述的一个算力资源调度的问题,需要一个对应的算力资源调度的算法来解决。在这个算法中,基本的维度就只有两个:一个是计算、一个是网络。
只是由于5G、边缘计算、人工智能、区块链等新因素带来了新的变量,使得算法需要综合考虑这些方面,从而形成了算力网络的三大功能。
  • 算力路由:网络能感知算力,并为其提供最优算力路由。
  • 算力调度:算网大脑智能编排、弹性调度全网算力资源。
  • 算力交易:基于区块链的算力可信和算力网络交易平台。

算力调度、算力路由、算力交易

算力网络的组成

如图所示,算力网络包含了三个部件,除了“算”和“网”以外,还引入了“脑”。

算力网络的组成
详细地说,这个“脑”就是:看得见,全域态势感知;调得动,跨域协同调度;可组合,多域融合编排;有智慧,智能辅助决策。基于不同业务的SLA要求、网络整体负载、可用算力资源池分布等因素,智能、动态地计算出算、网、数的最优协同策略。
算力网络就像是一台“超级计算机”,先汇集了全网的算力,再用“脑”把数据合理地分配到“超级计算机”的每个计算单元中。

算力网络的互联

算力网络的目标很明确,让用户在调用成百上千公里以外的计算资源时的体验与调用隔壁工作站的资源没什么区别。所以,对于算力网络来说,一张具有超大带宽、超低时延、海量连接、多业务承载的高品质网络是关键。那么,如何打造一张为算力连接提供高品质服务的网络,通过哪些技术来匹配网络的这些关键特征呢?
1、SRv6满足算力网络的泛在接入和敏捷开通
因为算力需要向海量用户提供服务,网络需要满足泛在接入的要求。
传统网络使用MPLS技术,往往采用工单传递、手工配置的方式,逐段开通业务,开通时间长,已无法满足需求;算力网络可以使用SRv6技术,自动化发放业务,业务开通时间从几天减少到分钟级,多段组网变为端到端组网,实现海量业务差异化SLA保障的泛在接入和敏捷开通。

SRv6满足算力网络的泛在接入和敏捷开通
2、网络切片确保算力网络的无损传输和安全隔离
在同一张算力网络上,需要为气象、高校、海洋研究所、企业等各种各样不同的业务提供服务,而这些业务对于网络的服务质量要求是不一样的。
传统网络按照“专线”思维来为不同业务提供差异化服务,VPN“专线”是一种软隔离技术;算力网络可以按照“专网”思维来为不同业务提供差异化服务,网络切片“专网”是一种硬隔离技术。在一张物理的算力网络上,网络切片进行资源切片隔离,形成多个虚拟网络。不同业务在自己的网络切片“专网”上独立传输,实现确定性的无损传输和安全隔离。
算力网络切片按需规划,首先创建默认切片,所有业务先全部承载在默认切片上;然后对于有特殊需求的业务,基于不同的SLA要求单独创建网络切片。例如,气象中心需要1G带宽保证的虚拟专网,就可以为气象业务单独创建网络切片。

网络切片确保算力网络的无损传输和安全隔离
3、随流检测实现算力网络的实时看护和智能运维
算力网络中存在海量的连接,这么多连接的统一看护和管理,对于网络的运维能力提出新的挑战。
传统网络的运维方法存在两个个突出的问题:业务受损被动感知,定界定位效率低下。往往用户投诉才能发现业务性能劣化,或者检出网络故障却难以快速定位。
在算力网络中,使用基于IFIT实现的随流检测,可以彻底改变这一局面。
随流检测在真实业务流中插入特定的“染色比特”,不仅可以做到精准定位丢包发生的位置,而且可以计算出逐跳时延和抖动,甚至能够进行路径还原,实现对于网络的实时看护和智能运维。

随流检测实现算力网络的实时看护和智能运维
4、云网安一体构筑算力网络的安全协同防护
安全是网络稳固的基石,而传统基于网络边界的防护思路,已经无法满足算力网络的需求。
在不同位置(云、网、端)部署不同的安全设备,堆砌安全产品,互相之间不兼容、不联动,无法适应业务上云后的路径变化,防护效果差、效率低。
采用云网安一体的安全架构,可以打造“可信一张网”,实现:终端安全、入网安全、网络安全、入云安全、云(平台、应用、数据)安全。
    • 部署乾坤云(安全大脑)+天关(安全边界),提供边界防护、威胁分析、常态化护网等安全服务。
    • 部署安全资源池+安全业务链,提供24小时智能分析和安全专家在线服务、租户级安全云服务、基于SRv6+SFC编排的安全算力和网络的一体调度。
    • 使用自适应量子加密创新方案,实现对于传统互联网IPSec加密机制的升级,提供可多点分发、可灵活组网、量子级密钥、原生级加密的安全保障。
    • 改变“一次验证,永久信任”的接入进制,采用零信任方案,构建身份安全基石,持续验证(永不信任)、动态授权、全局防御。

    东数西算织就全国算力一张网

    2021年5月,中国提出“东数西算”工程,通过构建数据中心、云计算、大数据一体化的新型算力网络体系,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动。
    2022年2月,国家发改委、中央网信办、工业和信息化部、国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。

    东数西算
    至此,全国一体化大数据中心体系完成总体布局设计,东数西算工程正式全面启动。

    在云边端协同场景下,打造算网融合创新技术方案,探索算网大脑雏形,深入车联网自动驾驶、超边缘生产现场、XR文娱、公共安全等特色行业场景,配合智能化技术,实现不同生产要素间的高效协同,从而提高生产效率,满足行业应用智能感知、泛在连接、实时分析、精准控制等需求,未来算力网络发展方向聚焦于:

    方向一∶泛在智能的新型算力赋能智慧社会转型升级
    随着智慧城市、智慧工厂、智慧家庭等智能场景的逐步落地,人工智能正深刻地改变我们的生产、生活方式,一个以数字化、网络化、智能化为特征的智慧社会正加速到来。机器学习、计算机视觉、自然语义处理等训练模型架构设计上趋向大规模并行,数据量已达千G量级,参数量迈向万亿级,此外无人驾驶、AR/VR云游戏、元宇宙等场景对数据的传输处理速度和快速分析、推理、决策能力提出了更高要求,需要构建多元化、规模化、泛在化的智能算力。一方面,以智算集群、无损网络、高性能存储为核心的智能算力解决方案有效提升计算效能、降低计算成本、缩短人工智能训练周期;另一方面,基于多样性算力的能力评估体系、云边端算力高效协同调度能力和智能应用的敏捷构建方式等新型技术,构建泛在协同的智能算力底座,推动人工智能从“单点突破”迈向“泛在智能”,实现智慧社会转型升级。
    方向二∶以数据为中心的多样性计算架构铸就高效算力服务
    全社会数字化转型带来多样化的海量数据处理需求,对处理效率提出了更高的要求,传统的以CPU为中心的计算架构难以高效应对复杂的数据处理场景,以数据为中心的新型多样化计算架构正在迅速兴起。以GPU、FPGA、AI芯片为代表的异构算力增长迅猛,以DPU/IPU为代表的软硬件深度融合的一体化计算架构逐渐兴起,突破传统冯·诺伊曼架构的近存计算、存算一体等存算融合新计算架构不断出现。这些架构变革以数据处理的高效性为目标,通过数据流驱动计算,对底层数据按需就近处理,极大提升数据处理效率。此外,面向多样性的新型计算架构,跨架构的开放编译平台已成趋势,通过屏蔽底层硬件架构差异,构筑开发环境友好、性能高效的算力服务。
    方向三∶光电联动的全光网技术支撑东数西算纵深发展
    “东数西算、东数西存、东数西训、东数西渲”带来跨地域、跨层次、跨架构的海量数据调度需求,对传送网络的容量、时延、成本、能耗等提出了更高要求。以OXC、400G/800G、OSU、SPN、50G PON、FTTR、硅光、新型光纤等为代表的新技术蓬勃发展,推动光传送网向基于光电联动的大带宽、扁平化、低时延的智慧全光网演进。通过大容量全光高速互联、灵活光电联动和智能全光调度,围绕算力构建高容量、高可靠、确定性低时延、绿色节能的光网络,以光筑底,支撑东数西算新型算力服务的创新发展。
    方向四∶超低时延驱动的确定性网络成为产业数字化刚需
    传统网络侧重公平性原则,提供尽力而为的服务,在消费互联网时代很好的满足了用户访问网络的需求。随着产业数字化转型进程加速,网络正从消费互联网向工业互联网演进,以超低时延和确定性为特征的网络正从辅助生产逐步嵌入到核心生产环节,成为产业数字化刚需。确定性要素从带宽向时延、抖动、丢包等多要素转变,满足算网连接业务多维质量需求∶确定性范围逐步从局域走向广域,通过切片和SRv6/G-SRv6实现端到端确定性保障;确定性粒度逐步从粗粒度向精细化转变,通过小颗粒切片、应用感知等技术满足差异化服务体验。
    方向五∶算网深度融合的原创技术驱动新型业务创新突破
    传统的算力和网络相对独立,二者仅为简单的连接关系。以NFVSDN为核心技术的下一代网络规模部署,算力和网络开始在基础设施层面逐步融合,随着5G+MEC的飞速发展,进一步驱动网络开始感知算力的位置,实现就近分流,算网融合的一体化平台服务已成趋势。未来,算网将在协议和形态层面进一步融合,网络将深度感知算力,通过在网络协议中引入算力信息,将应用请求沿最优路径调度至算力节点;网络设备通过共享自身算力,对数据进行在网计算,降低通信延迟,将推动无人驾驶、元宇宙等超低时延类新型业务创新突破。但深度融合计算和网络双学科并非一日之功,两大架构如何共存,如何互补是需要长期研究的课题,也面临许多科学难题有待攻克,需要两大学科共同研究和碰撞,推进算网向一体共生发展。
    方向六∶算网大脑使能多要素融合的一体化信息基础设施构建
    全行业数字化转型的加速对算网一体化基础设施和融合人工智能、大数据等多要素融合服务能力的要求日益提升。当前算网各自编排、分域管理,难以提供算网融合的产品、服务和端到端的质量保障。算网大脑通过算网数据感知获取全域实时动态数据,结合算网智能化、多要素融合编排实现要素能力的一体供给和智能匹配,横向全面融合网、云、数、智、安、边、端、链(ABCDNETS)多种能力要素,纵向深度贯穿应用、平台到底层资源,进而为新型信息基础设施对外提供一体化服务提供能力支撑。
    方向七:可信共享的算网服务开创行业发展新业态
    随着信息技术的发展,算力和数据的流动性持续增强,以多方可信的算力交易和安全可控的数据流通为代表的新型算网服务,将重塑信息服务产业价值链分配体系。通过算力交易创新模式广泛吸纳社会算力,基于区块链的多方算力可信共享将推动算力的供给侧改革,使算力的使用成本进一步降低,实现算力普惠,同时提升社会空闲算力使用效率,最大化发挥算力的价值。数据流通服务可实现跨行业、跨主体的数据共享和开放,通过联邦学习、隐私计算等技术为多方协作模式下的数据价值挖掘提供可靠保障,推动数据合法、高效利用,助力数据产业应用升级,打造数据应用服务新范式。
    方向八∶端到端的绿色低碳技术推动数字社会可持续发展
    全球气候变暖是当前人类面临的重大挑战,碳达峰、碳中和已成为应对气候变化的全球共识。根据权威机构统计,2021年底我国在用数据中心规模达到520万标准机架,算力达到120EFLOPS,未来仍将保持每年10%以上的速度增长。同时,数据中心能耗快速增长,2019 年数据中心年耗电量占全国总用电量的2.4%左右,预计到2025年数据中心年耗电量将达到全社会用电量的3.6%。为实现可持续发展,助力国家双碳目标,算网基础设施的建设和发展要以绿色低碳贯穿始终。随着芯片、服务器能耗控制技术的日趋成熟,模块化、工业化等新型建造技术的规模推广,高效、节能制冷技术的推陈出新,融合、低碳能源技术的广泛应用,辅以精准的碳评估与管理手段,从而形成从芯片、主设备到基础配套设施全生命周期、绿色低碳的数据中心建设与运营体系,并以数据中心为核心,结合数据中心间的网络连接,充分利用智能化手段实现网络和算力的跨地域、跨领域的节能调度协同,形成端到端的一体化节能体系,最终实现算力网络的创新节能、智慧洁能、绿色赋能,助力数字社会可持续发展。
    方向九:能力内生的新安全理念保障算网一体化全程可信
    从云计算到边缘计算再到分布式云,算力的泛在化引入了更多的安全风险点,更加开放的网络架构和更大范围的数据流动导致不确定性安全威胁增加,传统以安全防护为主的"外挂式”或“补丁式”安全建设模式无法应对上述安全问题,以安全能力内生、安全可信为基础的新安全理念应运而生。在资源高度协同、网络灵活开放、数据高速流通的算网环境中,充分应对动态变化的安全需求,引入安全编排、隐私计算、全程可信等技术,提升安全风险自动发现、自动防御的能力。
    方向十∶空天地一体的星云算网实现全时全域信息服务
    以卫星通信为代表技术的空天地一体化网络突破地形地貌对于通信网络的限制,从地面扩展到太空、天空、海洋等自然空间,形成全球全域覆盖和泛在连接的空天地一体化网络。空天地一体化网络突破时间限制,在瞬息之间完成大量数据的传输,并实现全域算力连接,通过天基和地基一体化信息构型,实现通信、感知、计算等要素的融合,赋能通感算一体化星云算网。空天地一体化星云算网将成为未来6G网络架构的重要发展趋势之一,为多域融合、算网融合的业务和应用的发展提供支持和动力。

    下载链接:

    RDMA在数据库上的应用实践

    RDMA技术原理白皮书

    NVMe存储基于SPDK加速I/O性能

    RDMA技术专题汇总(1)

    RDMA技术专题汇总(2)

    RDMA技术专题汇总(3)

    RDMA技术专题汇总(4)

    RDMA技术专题汇总(5)

    1、面向分布式AI智能网卡低延迟Fabric技术.pdf

    2、RDMA参数选择.pdf

    3、RDMA技术白皮书(中文版).pdf

    4、RDMA技术在数据中心中的应用研究.pdf

    5、华为面向AI时代的智能无损数据中心网络.pdf

    艾瑞咨询:2024年中国SDN与SD-WAN行业研究报告

    中国电信天翼视联:视联网云化技术白皮书(2024)

    数据智能白皮书(2024年)

    光通信深度:以太网在AI算力中的Why、How和What

    艾瑞咨询:2024年中国企业级SaaS行业研究报告

    2024面向 AI 智算数据中心网络架构与连接技术的发展路线展望白皮书

    光通信深度:以太网在AI算力中的Why、How和What

    工业交换机专题:连接工业设备,赋能新型工业(2024)

    NVMe over RoCEv2 网络优化技术要求和测试规范

    云计算研究报告

    2024年中国边缘云市场报告
    《IPv6+创新与标准技术合集》
    1、IPv6+创新与标准 2、IPv6创新赋能:可预期智算网络

    面向超万卡集群的新型智算技术白皮书

    面向AI大模型的智算中心网络演进白皮书

    网络系列报告之交换机概览:IB性能占优,以太网开放占优

    中国分布式存储产业未来发展空间广阔(2024)


    本号资料全部上传至知识星球,更多内容请登录全栈云技术知识星球下载全部资料。

    ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧  END  ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧

    免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言删除,谢谢。

    温馨提示:搜索关注“全栈云技术架构”微信公众号,“扫码”或点击“阅读原文”进入知识星球获取10000+份技术资料。

    全栈云技术架构
    涵盖微服务架构、云计算、边缘计算、高性能计算、云边协同和训练推理。
     最新文章