独家整理:光模块产品技术基础知识-2025.1

2025-01-23 07:36   北京  

前言,光模块(如400G、800G、1.6T等)在智算中心的投资中占比较高,现有公开的光模块介绍资料都偏碎片化和老旧了,我最近搜集整理了一些资料,结合大家日常比较关心的产品技术、专业术语、发展趋势和品牌情况等和大家做个分享!

一、光模块的定义和工作原理

1、什么是光模块:光模块是光纤通信系统的核心器件之一,其为多种模块类别的统称,主要包括光接收模块,光发送模块,光收发一体模块和光转发模块等。当前市场中光模块一般指代的是光收发一体模块,光模块用于光信号的传输,传输媒质为光纤。光纤传输方式损耗低,传输距离远,在长距离传输方面具有天然优势。

2、光模块的组成:通常情况下,光模块由光发射器件(TOSA,含激光器)、光接收器件(ROSA,含光探测器)、驱动电路、放大器和光(电)接口等部分组成。

3、光模块工作原理:主要用于实现电-光和光-电信号的转换,如下所示:

  • ① 在发射端,一定速率的电信号经驱动电路处理后进入光发射器件;

  • ② 处理后的电信号驱动激光器发射出相应速率的调制光信号,通过光功率自动

  • 控制电路,输出稳定光信号;

  • ③ 在接收端,一定速率的光信号由光探测器处理后转换为电信号;

  • ④ 处理后的电信号经过放大器后输出相应功率的电信号。

二、光模块的发展历程回顾

光模块行业已有近30年的发展历史,从发展历程来看,光模块形成行业的关键时点为20世纪90年代中期。

1、90年代以前,光模块未形成行业概念,光模块均由设备制造商自行设计研发,外形尺寸和机电接口没有统一标准且兼容性差,这对电信运营商的联通造成诸多问题。

2、90年代中期至2000年初,光模块行业正式形成并开始发展。90年代中期,由相当数量的设备制造商和电信运营商成立MSA组织(多源协议行业联盟),推动了光模块的标准化,光模块行业就此形成。

3、21世纪的前10年,光模块行业进入发展初期阶段,相关技术不断取得突破和应用。在该阶段,行业经历了封装形式的不断迭代、传输速率的逐步提升、接入方式的升级,逐步实现了模块小型化,其中SFP和XFP的诞生分别为小型化的关键节点。

4、2010年开始,光模块行业进入了发展加速阶段,高速化成为了行业发展重点。在初期技术逐步成熟的支持下,光模块的传输速率开始实现快速提升,在该阶段的开始便实现了100Gbs的飞跃式进步,2015年后200Gbs和400Gbs也快速跟进,当前已成为市场主流应用速率。

5、2020年后,光模块行业技术升级速度进一步加快。随着AI智算产业的加速发展以及社会经济对智算中心的需求扩大,光模块行业的发展重点侧重于高速化、高集成、低成本和低功耗。当前800Gbs的光模块已经广泛应用,1.6T的光模块也将计划量产,而具有更高技术含量的硅光也将在未来逐步成为行业突破方向。

三、光模块的封装类型

常见的光模块封装类型有SFP、SFP+、SFP28、QSFP+、QSFP28、QSFP56、QSFP112、QSFP-DD、 OSFP、CFP、CFP2等。

1、SFP、SFP+、SPF28等

SFP:全称是Small Form-factor Pluggable,翻译过来就是小型封装可热插拔,常见的传输速率为1.25G、2.5G,SFP封装是低速光模块市场上主要形态,尺寸比较小,在SFP之前还有GBIC通常为1G传输速率,但是尺寸上SPF更小。

  • SFP+:可以理解为是SFP的增强版,传输速率提升至10G,但是尺寸大小没有变化,SFP+光模块可后向兼容SFP,10G的市场目前依然是以SPF+为主。

  • SPF28:SFP28光模块是在SFP+的基础上进一步提升的光模块类型,传输速率为25Gbps,和SFP+具有相同的尺寸,但其能支持单通道25Gb/s的速率。

  • 其他SPF相关:如SFP56常见传输速率50Gbps,最高可支持至56Gbps,SFP112常见传输速率100Gbps,最高可支持至112Gbps,不同的SFP细分产品虽然都是以SPF开头的光模块,尺寸大小基本上一样,因为传输速率的大幅提升,光模块所使用的调制方式会发生变化。

2、QSFP+、QSFP28、QSFP56、QSFP112、QSFP-DD系列光模块

QSFP+的全称是Quad Small Form-Factor Pluggable Plus,集成了4通道10G速率的光模块,与SFP+相比,速率提升了4倍,但尺寸只增加了一倍;QSFP除了基础的QSFP+外,还有其他四通道封装的如下:

  • QSFP28:4*28G,常见速率为4*25G,也就是100G,QSFP28封装的光模块通常默认为100G光模块。

  • QSFP56:4*56G,其单通道速率为50G,是主流200G光模块的封装类型。

  • QSFP112:4*112G,其单通道传输速率100G,QSFP112是主流400G光模块封装类型之一。

QSFP-DD,Quad Small Form Factor Pluggable-Double Density,DD指的是“Double Density”。将QSFP的4通道增加了一排通道,变为了8通道,一般来说QSFP-DD指的是8*50G,也就是400G传输速率的光模块。

除了QSFP-DD,还有QSFP-DD800,是指8*100G,即800G,QSFP-DD1600,是指8*200G,即1.6T。

3、 OSFP系列光模块

OSFP,是Octal Small Formfactor Pluggable的缩写,Octal是八进制的意思,在这里表示光模块用8个56G通道来实现400GbE。尺寸略大于QSFP-DD,56GbE的信号是25G的DML激光器在PAM4的调制下形成的。该标准为新的接口标准,与QSFP-DD不兼容。

除了OSFP还有OSFP800,OSFP1600,OSFP800是指8*100G,即800G。OSFP1600是指8*200G,即1.6T。

四、光模块的接口类型(SC、LC、MPO):

我们在最新的800G光模块的参数里经常会看到,MPO16/APC接口,这个怎么理解,和传统的LC和SC有何区别?

1、各类接口概述

MPO接口,是多芯光纤连接器(Multi-fiber Push On/Pull Off)的缩写,是一种设计用于高密度光纤连接的标准化接口。MPO 连接器可以一次性连接多根光纤,通常将12芯光纤排为一列,也可支持一列或多列光纤在同一个 MPO 连接器内。根据连接器内排放的芯数不同,可分为一列(12芯)、多列(24芯或以上),其标准由IEC 61754-7规范进行定义。

  • SC接口是Subscriber Connector的缩写,其接头是一种常用的光纤接头类型,它采用直插式连接方式,即光纤连接时需要将光纤插入接头中并旋转锁定。

  • LC接口是Lucent Connector的缩写,其接头是一种小型光纤接头,也是一种直插式连接方式,与SC接头类似。

  • FC接口是Ferrule Connector的缩写,其接头是一种螺纹式连接方式的光纤接头,它使用螺纹进行连接,并需要用手旋转接头来完成连接。

  • ST接口是Straight Tip的缩写,其接头是一种较为古老的光纤接头类型,它采用圆形接头和圆形插座的连接方式,需要通过旋转锁定来固定连接。

以下5种接头的图片对比如下:

2、APC是什么意思?

是指连接器的端面结构,如下图所示,MPO连接器又可以分为MPO/PC平面连接器和MPO/APC斜面连接器,APC是比较常用的。

五、与光模块配套的互联线缆:DAC/ACC/AEC/AOC

以目前智算中心主流的400G 光模块连接方案举例,总结来看相比于有源光缆 AOC,铜缆具备失效率低、功耗低以及成本低的优势,是短距离场景性价比最高的选择:

1、DAC 400G指无源直连电缆。能使用导电铜线在网卡间、网卡与SW间和SW间进行连接。DAC的内部结构通常采用屏蔽双芯设计,不包括有源元件,功耗小于0.1W,成本是四种方案中最低的。DAC 铜缆主要用于系统内机架连接,将计算服务器连接到存储子系统,最大长度一般为3米;

2、ACC 400G主要是指有源铜缆,无源 DAC仅使用铜线,没有电子器件,功耗为零,延迟和插入损耗最低。新的有源DAC,又名有源铜缆 (ACC),在电缆端部包括信号增强集成电路 (IC),与400G DAC 电缆相比,400G ACC 电缆的功耗和成本更高,但线性放大器相较于重定时器(AEC 使用的有源器件)成本更低。有源芯片可以补偿铜缆传输造成的部分损耗,ACC的传输距离是DAC 的2到3倍。

3、AEC 400G 有源电缆是一种特殊类型的有源DAC。400G AEC 作为 400G AOC的可靠即插即用替代方案,然而,能的功耗只有 400G AOC 的一半,而且成本更低,介于 400G DAC 和 400G AOC 之间。能在电缆组件内包)多个重定时器,解决数据丢失的问题——一个放在电缆的开头,一个放在末端,AEC 的重定时器可产生更清晰的信号,消除噪音并放大信号,以实现更清晰、更清晰的数据传输,从而确保更远距离的高速传输,传输距离为 3-7 米;

4、AOC 400G 有源光缆利用光纤作为传输介质,将电信号转换为光信号。由于 AOC的光纤芯由绝缘材料制成,因此在数据传输过程中不易受到电磁、闪电或无线电信号的干扰,功耗约为10W,由于与铜缆相比,光纤的成本普遍较高,因此 400G AOC的价格通常高于 400G DAC(假设水平或封装相似)。400G AOC 的最大传输距离可达100米。

400G DAC,AEC,ACC,AOC逻辑链接结构对比


六、IB组网对应的光模块用量测算

以英伟达H100集群为例,DGX H100包括8张H100 GPU,同时配置8张400G CX-7网卡,共8个400G接口,带动大量400G、800G光模块的需求。英伟达DGX H100 SuperPod 服务器示意图如下:

  • 每个计算单元(SU)有32个节点,每个节点8块GPU;

  • 每个GPU与ConnectX-7网卡相连,网络架构采用无阻塞的胖树架构;

  • 采用 Infiniband 互联技术,第一层与第二层之间使用400G光模块,其余层使用800G光模块;

  • 在网络层数分别为1/2/3的情况下,GPU:400G:800G分别为1:1:0.5/1:1:1.5/1:1:2.5。

不同H100集群规模对应的交换机和光模块数量参考一览表:

六、目前已公开的某厂商800G光模块参数举例

六、硅光芯片/模块的发展趋势

硅光技术是CPO方案的主流选择,未来在智算、HPC等领域将起到重要作用。硅光技术由于不需要气密封装,CMOS兼容更易与电芯片集成且硅光调制器和探测器均可支持56GBaud以上速率等因素,成为了CPO光引擎的主要方案。高性能计算方面,硅光技术有助于解决高性能计算平台中的功率问题合IO以及带宽密度的挑战。硅光技术正在彻底改变长距离通信和数据中心运营。硅光技术因其高集成度、高带宽、低时延及低功耗的特性在通信和人工智能领域有较大潜力,目前应用于数据中心光学互连和CPO的相关产品开发正在进行中,共封装光学器件 (CPO) 预计将在 2025年后在高性能计算 (HPC) 领域取得重大进展。

主流的硅光芯片/模块的厂商情况

以下是广告,算力之光商城,提供主流算力设备方案的供需拉通(可点击)!

----老张会持续通过公众号分享前沿IT技术,创作不易,大家多多点赞和关注!

IT技术分享-老张
北漂it民工,目标做最接地气的科普类文章!分享IT行业服务器相关的前沿技术、产品和方案,聚焦AI、信创、液冷、智算中心等相关细分领域!入交流群或商合可+vx(zcyaihuai)!
 最新文章