每日一芯 | 北中网芯可编程网络数据处理芯片(DPU)

文摘   2024-11-25 16:03   上海  

可编程网络数据处理芯片(DPU)NE6000


产品描述


NE6000是一款具有双向200Gbps处理性能的自主可控数据处理芯片(DPU)。该芯片采用Soc-NP架构,内置3类共10个精简指令集的通用处理器核(CK-Core),以及8个NP-Engine Cluster,共384个NP-core。另外,该芯片集成了多个硬件加速引擎,并对外提供丰富的高速接口,在具有业务处理的高性能、灵活可编程的同时,还具备低功耗的特点。


CK-Core实现管理平面处理的可编程特性,满足对性能要求相对较低的复杂协议处理的需求。


NP-Engine实现数据平面和控制平面的可编程特性,满足双向200Gbps的报文转发处理能力。NP-Engine的编译器、指令集、处理器均为自研。编译器和指令集通过摒弃通用处理器核中与网络处理无关的部分,重构并深度优化网络处理特性部分,实现数据处理性能大幅提升;处理器采用自定义超长指令集(VLIW)、单指令多数据流(SIMD)以及多发射等设计,实现多核并行处理、正则表达式处理、报文解析、查表以及报文编辑等功能。


芯片内部集成多个硬件加速引擎,包括:统一表项管理引擎、深度报文检测(DPI)引擎、TCAM引擎、调度管理引擎、缓存管理引擎等。统一表项管理引擎可实现表项规格灵活配置; DPI引擎可实现高性能全包和跨包字符匹配查找;TCAM引擎可实现多元组模糊匹配查找;调度管理引擎可实现NP-Engine、CK-Core以及其它硬件加速引擎的调度管理;缓存管理引擎可实现多端口数据包集中缓存和端口转发。


该芯片支持级联,级联接口传输能力高达100Gbps,传输延时小于1us。支持芯片的横向与纵向级联,通过芯片级联,可实现表项扩展和性能扩展。


NE6000芯片架构及外部接口形态如下图所示。



该芯片采用28nm制程工艺,从流片到封装、测试均在国内完成,芯片所有IP均为国内厂家提供,核心功能模块均为自研。


(一)网络处理

1.支持对以太网2~7层报文的解析、编辑等处理;

2.支持基于连接的状态检测;

3.支持多端口负载均衡,支持乱序重排;

4.支持基于规则限速,基于连接做流量统计;

5.支持OVS、VirtIO、Overlay网络加速;

6.支持报文分片与重组;

(二)硬件加速

1.支持NP处理器和通用处理器调度引擎;

2.支持多端口共享缓存管理引擎;

3.支持统一表项管理引擎;

4.支持精确匹配流分类引擎;

5.支持直接查表引擎;

6.支持DPI引擎;

7.支持HASH查表引擎;

8.支持防重放引擎;

9.支持Timer引擎;

10.支持Counter引擎;

11.支持Meter引擎;

12.支持TCAM查表引擎;

13.兼容DPDK,支持多传输队列;

14.支持SRIOV;

(三)可扩展性

1.通过芯片级联,实现表项扩展;

2.通过芯片级联,实现数据同步;

3.通过芯片级联,实现处理器核增加;

(四)灵活性

1.支持微码在线不断流升级;

2.支持根据微码对任意格式报文的解析;

3.支持根据微码和查表结果对报文做任意编辑;

4.支持根据微码和查表结果对报文做任意转发;

5.支持根据业务特点进行表项规格重排;

6.支持连接状态、表项等重要数据同步备份,同步带宽可高达100Gbps;

7.支持网络接口多种协议速率灵活可配置;

(五)安全性

1.支持安全启动;

2.支持IPSEC/TLS;

3.支持基于正则表达式的DPI过滤。


技术指标

(一)报文处理能力

1.支持200Gbps@64Byte报文线速接收能力,支持无损以太网流控;

2.支持200Gbps@512Byte报文线速业务处理能力;

3.转发处理延时小于2us;

4.支持100Gbps@4万条DPI规则;支持10Gbps@12.8万条DPI规则;

5.支持90Mpps报文头的可编程解析/转发/编辑;

6.支持64个NP引擎,每个NP引擎的解析/转发/编辑能力≥5Gbps;

7.内置TCAM支持128K IPv4/64K IPv6五元组模糊匹配规则;

8.支持超过3千万连接的状态实时检测;

9.每秒新建连接数大于100万条;

10.芯片内部报文缓存容量8MB;

11.芯片内部表项容量8MB,表项规格灵活可配置;

12.支持不断流NP微码升级,升级时间不超过20ms;

13.典型工作功耗25W;

(二)外部接口

1.3组4*25Gbps Serdes接口,每组接口均可配置为不同速率的以太网接口形态,包括1*100GE/1*40GE/4*25GE/4*10GE/4*1GE;其中一组4*25Gbs Serdes还可配置为级联接口,并具有小于1us的传输延时;

2.4组4*12.5Gbps Serdes接口,可配置为PCIE Gen3x16,或PCIE Gen3x8,或GEN3x4,空余Serdes可配置为40GE/10GE/1GE以太网接口;

3.2个RGMII接口,其中一组可配置为RMII接口;

4.1个RMII接口作为设备管理接口;

5.1个72bit (64bit数据+8bit ECC) DDR3/4接口,最高速率可达2400Mbps;

6.1个SPI接口;

7.1个QSPI接口;

8.3个四线UART接口;

9.2个I2C接口;

10.1个MDIO接口;

11.48个可编程GPIO接口,可配置为I2C/UART/SPI/MDIO等;

(三)其它

1.工作环境温度:-40~85℃;

2.芯片工艺:UMC28HPC 1P10M;

3.芯片封装:35mm*35mm;

4.封装形式:FCBGA1760;

5.工作电源要求:3.3V(IO),1.8V,1.2V(IO/模拟逻辑),0.9V(数字逻辑)。


NE6000为国内首颗在国产自主可控基础上,成功解决25GE和100GE网络接入问题的芯片,并且具有提供双向200Gbps网络数据处理能力的芯片。同时,NE6000是国内为数不多的基于网络处理器架构(NP架构)研制的芯片,其它厂家仅华为、中兴有相关研制。相对于专用交换芯片,NE6000在提供高性能网络接入的同时,仅通过微码升级即可适应任何网络协议的变化;相对于CPU,NE6000有几倍甚至几十倍的网络数据处理性能,并且远远低于CPU的处理时延和功耗;相对于国内最先进FPGA,NE6000有其数十倍的逻辑资源,并能提供更强的可编程能力,具有更强的处理性能。


2023年,北中网芯NE6000 可编程网络数据处理DPU芯片产品销量达4300万元。主要面向商密服务器领域提供基于芯片的解决方案,出货量700余片,根据公开资料,2023年国产商密服务器出货量预计达1.7万台,因此,面向整个商密服务器(服务器密码机)市场,相关产品市场占有率约达4.17%。


面向通用服务器市场,中国通用服务器2023年出货量达500万台,其中运营商及其他高性能网卡需求场景约占70%,10G/25G高性能智能网卡需求量约占66%,以单台云服务器中需要两个DPU芯片核算,北中网芯2023年NE6000-NE5025出货量达52000余片,核算全国产化市场占有率达3.71%。


应用情况


基于芯片打造启联高性能智能网卡产品、基于自研芯片的应用解决方案:IDS入侵检测解决方案、防火墙网络安全解决方案、IPSecVPN平台解决方案、高速数据分流解决方案、分布式端到端安全解决方案、安全态势感知平台解决方案。




未经授权,不得转载

ICDIA(IC Show)2024中国集成电路设计创新大会9月全新启航!

2024金芯奖 · 汽车电子创新评选火热开启!申报通道正式开放

第二十一届中国通信集成电路技术及应用大会暨上合新区集成电路产业创新发展大会在青岛胶州成功召开

我国集成电路产业发展中的“内卷化”研究与应对建议

《中国集成电路》严正声明

我国三代半进入高速增长阶段

中国半导体行业协会召开第八届理事会专家委员会成立大会暨第一次工作会

这场办了30个年头的IC设计业盛会,缺你不可


CIC集成电路
·把握信息时代芯脉搏·掌舵变局当下核动力· 中国半导体行业协会(CSIA)会刊《中国集成电路》(CIC)杂志唯一官方认证账号。 引领发展,推动创新,推广应用,CIC创刊28载,始终潜心凝聚集成电路中国力量。
 最新文章