众所周知,Broadcom一直是CPO的拥趸者,在不断优化CPO性能的同时,近期又与康宁公司合作发布了关于CPO种光纤部署的联合白皮书,以降低CPO交换机制造流程的风险。白皮书深入探讨了如何在 CPO 环境中保持光纤可靠性。不当的光纤质量控制和电缆组装程序可能导致光纤断裂,并造成严重的运营后果,例如整机更换。
共封装光学器件(CPO) 是数据中心(DC) 中使用的高带宽交换机和分布式计算硬件架构中备受期待的革命。主流技术涉及机箱内的电气连接,其中光学/电子收发器插入面板(“可插拔”)并连接到将交换机、服务器、分布式内存和处理器连接在一起的光纤。随着链路带宽的增加和对更高功率效率的需求的增长,几乎无损的光纤将进入机箱以取代有损的铜线,并允许收发器(TRX) 更靠近交换机ASIC 或 GPU 等核心组件。现在,机箱将包含大量(数百甚至数千)光纤链路,这些光纤链路位于紧密耦合的电子集成电路(EIC) 和光子集成电路(PIC) 之间,这些电路构成了密集集成的TRX 和面板。
虽然引入 CPO光学基础设施可以大大降低在DC 中不同位置之间传输数据所需的功率,但这些交换机厂商可能不熟悉这种基础设施。此外,大量光纤电缆与电气元件和风扇的紧密结合使温度持续升高到前所未有的程度。
使用可插拔设备可以实现故障单元的“热插拔”,但随着CPO 的出现,任何链路故障都可能需要更换整个交换机。因此,CPO交换机的可靠性至关重要,设计人员和厂商必须确保光学基础设施的部署和组装过程不会损害原料子组件的可靠性。
CPO 可靠性要求尚未明确定义,但可靠性工程师的合理工作目标是整个 CPO 基础设施的预期使用寿命至少为 5 年,每年故障率小于0.1%。这与 CPO 之前的经验一致,即需要更换整个组件的交换机故障的全因率约为每年 1%。
在 CPO 交换环境中部署的硅基玻璃光纤的可靠性在这时就尤为重要。在这种交换环境下涉及的光纤包括Tx/Rx 信号路径中使用的单模光纤和外部激光源传输功率的保偏光纤。
交换机中的光纤数量越多,发生光纤断裂的概率就越高。
在对光纤进行任何操作时,必须避免可能损害其可靠性的三个因素:
1. 施加较大的拉伸应力
2. 损坏玻璃丝表面
3. 损坏涂层的完整性
如果出现障碍物或弯曲,即使是短暂的,也会产生过大的拉伸应力,从而大大增加导致故障的概率。因此必须指定并遵守光纤的最小弯曲半径,以及避免光纤扭结和弯曲
交换机中的光纤布局设计不仅必须考虑光纤疲劳应力极限,还必须考虑光纤涂层的热环境,因为如果这些因热降解而受损,光纤的玻璃表面可能会在设计寿命之前受损和断裂。
标准光纤涂层能够在远高于运行中的CPO 组件预期的温度下长期运行 ,并且可以使用专门的高温涂层,但必须避免潜在的热点,并且必须考虑光纤和光纤束的绝缘性能以避免产生热点。如有必要,应使用垫片或布线硬件将光纤基础设施保持在合适的微环境中。涂层的机械环境也是一个重要的考虑因素,因为涂层完整性的丧失可能导致玻璃表面损坏,从而缩短光纤寿命。必须避免挤压、磨损和划伤,以防止涂层失效。因此,光纤不应部署在粗糙或锋利的表面上,也不应穿过狭窄的开口,因为随着时间的推移,再加上机械冲击和振动,可能会导致损坏。特别是,光学连接的应力释放结构必须遵守制造商对光纤及其包装(电缆、带状等)施加应力的限制。
由于与玻璃丝的任何接触都可能导致新的微观表面缺陷,从而导致光纤故障,因此安装在盒子中的子组件中不应有暴露的玻璃。此外,必须注意不要损坏光纤涂层的完整性。为避免涂层出现划痕、割伤、磨损和穿孔,在交换机设计和可能放置光纤的组装环境中,必须尽量减少锋利的边缘。光纤必须通过屏蔽或布线硬件防止接触。挤压或夹紧光纤产生的过大压力也会导致涂层分层,从而损坏涂层,而暴露于有机溶剂会削弱涂层材料。应避免使用颗粒物(尤其是硬质颗粒物),并控制静电力,以避免出现故障模式,即颗粒物被吸引到光纤涂层表面,然后被外部压力驱使穿过涂层,最终损坏和削弱玻璃表面。在CPO 应用中,可能会部署直径减小的涂层光纤,以减少光纤基础设施的体积,并通过降低刚度来提高机械柔顺性。必须控制组装工具和程序,以确保减小的涂层厚度不会导致更紧的弯曲或因磨损或穿孔而导致的玻璃表面损坏。
此外,组件还将经过一系列筛选测试以确保“良好光纤”。这些测试包括回波损耗(RL)、光学相干元件反射测量(OCCR)、插入损耗(IL) 和目视检查。
设计光纤布局可以促进组装和维修中的可靠性。除了确保长期机械可靠性外,光纤布局的设计还应支持CPO 模块组装或维修期间的良好可靠性实践。
良好的设计实践包括:
1. 尽可能避免不同光学组件的交织或缠绕。
2. 保持每个光学组件整洁,以便可以不受干扰地处理单个电缆或光纤。
3. 为基础设施的作业提供清晰的路径,以最大限度地降低光纤被钩住或夹住的风险;特别是,覆盖在光学基础设施上的模块组件应该是可移动的,以便在需要维修时可以进行访问。