前几天笔者大体讲了一下共封装光学CPO概念,今天来详细拆分一下细节,方便大家更好的寻找投资标的。笔者认为投资共封装光学CPO概念标的,必须要搞懂三个问题:为什么需要CPO,什么是CPO,CPO应用面临的挑战。搞明白这三个问题,你基本就可以清楚哪个标的正宗,哪个标的真实价值,哪个标的敢长持。下面笔者按照这个思路一一展开。
为什么需要CPO?
共封装光学CPO是一种旨在解决当今数据密集型网络中带宽密度、通信延迟、及能效等日益增长的挑战的方法,其通过将通信所需的关键元素,即光学和电子组件,更紧密地集成在一起来实现这一目标。
为了方便大家理解,笔者翻译一下。数据密集型网络就像是一个超级忙碌的高速公路系统,专门用来处理和传送大量的信息。AI大模型的训练和推理过程非常依赖于这种数据密集型网络。带宽密度指的就是高速公路上的车道数,当然是车道数越多越好。通信延迟指的就是高速公路上堵不堵车,当然是不堵车最好。能效指的就是百公里耗油,当然是耗油少最好。CPO就是拥有高带宽(车道多)、低通信延迟(不堵车)以及能效高(耗油少)的特点。随着传统的铜缆和可插拔光模块遭遇带宽密度、通信延迟、及能效等问题,AI数据中心非常需要CPO横空出世。
目前,行业使用了多种术语,如光输入/输出(OIO)和CPO,这有时会导致混淆,尤其是近封装光学(NPOs)经常被错误地标记为CPOs。需要澄清的是,CPO的更广泛趋势与OIO相同,即向采用芯片组技术的方向发展,其中光学元件被集成在三维集成电路(3D-IC)封装中。所以一般意义上,大家认为CPO和OIO差不多也没什么问题。
共包封装光学CPO的优势
博通和思科的CPO解决方案已经显示出显著的功耗降低,节能达到30-50%。这些解决方案的互连功率效率低于每比特1皮焦。Ayar Labs(英特尔)展示了令人印象深刻的每秒16太比特的双向吞吐量,能效低于每比特5皮焦。如果你不懂这些术语,换句话说,就是这比传统的铜缆和可插拔光模块可省电多了。
CPO技术以几种不同的方式节省电力:
无损耗铜迹线:与可插拔光学不同,CPO消除了信号从应用特定集成电路(ASIC)经过耗能的铜连接到前面板的传输需求。相反,CPO直接将光纤引入交换机,使芯片和光学引擎之间的通信短且损耗低。 更少的数字信号处理器(DSP):在当前架构中,对于每通道速度超过25G的情况,DSP基的重定时器在可插拔光学中是必需的,以积极校正信号退化、失真和时序问题。这些DSP可能会使整个系统功耗增加多达25-30%。然而,由于CPO消除了ASIC与光学元件之间需要损耗的芯片外铜迹线,可以安全地移除一个DSP级别以节省能源和降低成本。 集成激光器:关于激光源放置有两种主要的思路。常用的方法是使用外部激光器,通过光纤传输光线并将其耦合到CPO中,通常会造成30-50%的光学功率损失。另一种方法是直接在芯片上集成激光器,这可以提供显著更好的光学耦合。 目前博通等公司的产品都是用的第一种方案。主要有两个原因,一个是热管理问题,片上集成激光器在长时间运行时会产生大量的热量,热管理问题现在还没有什么好的方案解决。第二个是激光器可靠性问题,激光器长时间运行不稳定会造成激光器损坏,如果直接集成在芯片上,只要激光器坏了整个芯片都要更换。笔者认为,任何厂家也不愿意赔钱做生意。
什么是CPO?
因为CPO技术最先应用在就是交换机中,所以以CPO交换机举例,图中是美国康宁公司的CPO方案。我们这里主要看图的中间部分,CPO交换机核心就是将交换机ASIC芯片与Optical Engine光引擎封装在一起。大家可以简单理解为将ASIC芯片和光引擎封装在一块Substrate基底板子上,注意这里不是PCB板子。
如果还没看懂,笔者就再详细讲讲。先说一下传统可插拔光模块。下图的上半部分是俯视图,下半部分是侧视图。可以很清楚的就明白了,可插拔光模块的光引擎Optical Engine和ASIC芯片是独立的,虽然在一块PCB板子上,但是不在一块Substrate基底板子上。这样做还有个弊端,就是会增加xxx的使用,这里笔者留个思考题。
然后是CPO方案,下图的上半部分是俯视图,下半部分是侧视图。是不是一眼就看清楚和可插拔光模块的异同了,光引擎Optical Engine和ASIC芯片的位置发生了明显变化。但是眼尖的会发现问题,笔者前面不是说封装在同一块Substrate基底板上,为什么Substrate上面还有个Interposer。这是因为传统的Substrate基底已经不能完全满足现代电子产品对性能、小型化和集成度的要求。这里不涉及到核心就不展开讲了。
CPO应用面临的挑战
这节非常重要,也恭喜有耐心读到这里的朋友,仔细看你会发现宝藏的。
可靠性和现场维护性问题:与可快速更换或在故障时交换的模块化可插拔光学不同,CPO系统中更换光学元件通常涉及拆除整个交换机,需要相当的专业技能来执行复杂的服务任务。为了缓解这一问题,CPO设计将如激光器这样的高风险活动组件放在一个更容易现场更换的远程可插拔模块上。此外,还在探索可插拔光学连接器的发展,比如LPO。笔者这里重点讲讲这个LPO,很多人后台留言说更相信LPO能先落地,CPO更远。笔者不否认这种逻辑,先落地更好。又比如AEC有源电缆落地了也挺好,但是你连起码的价值量都不会计算就开始买标的了,笔者心里也是五味杂陈的。
好了,说说这个可维护性。为了解决这个问题,博通、森高、康宁这些公司都是用的可插拔激光器方案,这种情况下就方便维修了,坏了直接换一个激光器就好了。下图橘黄色部分就是可插拔激光器。第一个问题到此也就算解决了,其实还有很多其他方案,笔者这里就先按下不表了。
热管理:在电气封装内集成光子集成电路(PIC)可能会增加热串扰的可能性。PIC的加热器和激光源产生的热量会影响整个封装的温度图,而电气模块产生的热量和系统的冷却机制会影响PIC的热行为。因此,从芯片到系统级别的全面热分析至关重要。这里就涉及到温控问题,激光源挪到外边虽然解决了一部分热管理问题,但是PIC加热器的热管理问题仍然存在。前几天传的台积电与博通共同开发合作的CPO关键技术微环形光调节器(MRM)已经成功在3nm制程试产。其实之前博通展示过一种方案,先用液冷降温,再用专门的加热器来控制微环的折射率,进而保证光器件的可用性。
信号完整性和功率完整性:确保整个系统内信号和功率的完整性需要进行瞬态模拟,包括电气和光子电路模拟,同时考虑在封装阶段引入的各种电气互连的附加寄生效应。这些优化电路设计和布局等,属于工程化问题,这里笔者就一笔带过。
可扩展性和芯片边缘的带宽密度:芯片边缘的带宽密度,是CPO和OIOs的一个关键指标,因为光纤通常是边缘耦合的。给定的基板尺寸限制了光纤的最小间距要求。波导和光纤尺寸之间的巨大差异为边缘耦合解决方案带来了固有的扇出挑战。光纤阵列单元(FAU),负责将光纤与波导对齐,在CPO应用中变得更加关键。实现低耦合损失需要严格的位置公差和良好对中的核心。为了适应CPO中的高密度,需要使用更高光纤数量的FAU,如32或64根光纤的FAU。制造CPO用的FAU应考虑保持偏振光纤(PMF)的方向和偏振消光比(PER),同时保持光纤的高内在可靠性。由于CPO和电信应用之间的相似性,为电信环境制造FAU的经验可能具有优势。
光纤故障:光纤故障机制包括断裂、变暗和“光纤熔断”,但鉴于预期CPO使用的波长和功率范围,这里只讨论光纤断裂问题。光纤受力最常见的方式是弯曲,这也是导致光纤断裂的主因之一。因此,在CPO开关或处理箱内布局光纤基础设施的设计师必须考虑弯曲配置如何影响光损失以及光路的可靠性。康宁专门提出了基于二氧化硅的玻璃光纤,并提出了一种带状管理设备,如下图所示。
以上就讲清楚了 CPO 交换机内部的关系,外部主要涉及接口的问题,比如多光纤连接器 MPO 等。MPO 里面又涉及到 MT 铁芯等。
以上就是全部正文的内容了,有心人一眼就能看出核心标的。下一篇文章是付费文,大家不必付费,看看付费文的免费部分笔者认为就足够有帮助。
专注分享财经信息的专业社区,喜欢请点击下方名片关注。
免责声明:本文材料整理于公司公告、新闻、机构公开研报及社交媒体网络等,对文中所涉专业及个股均不构成投资建议。市场有风险,投资需谨慎。图文如有侵权或违反信批规则请后台留言联系删除。
文章精彩,防止走失,可关注、转发、投币打赏。