引言
随着计算系统向支持数据密集型应用的大型多核芯片发展,2.5D集成正成为有前途的平台。在2.5D系统中,多个较小的chiplet集成在一个大型中介层芯片上。这提供了更高的制造良率和异构集成等优势,但也为片上通信网络带来了挑战。
传统的电气链路难以为大型多核芯片提供所需的带宽密度。硅基光电子链路正发展成为高带宽、低延迟的替代方案。然而,微环谐振器(MRR)等硅基光电子器件对热变化和制程变化非常敏感,这可能导致谐振偏移并影响通信可靠性。
本文探讨了在2.5D系统中管理硅基光电子网络的系统级技术,重点是减轻热变化和制程变化的影响,以提高能源效率。
光学器件的热敏感性和制程敏感性
MRR是硅基光电子链路中的关键组件,用于数据调制和滤波。MRR的谐振波长由其物理尺寸和材料特性决定。导致MRR谐振波长偏移的两个主要因素是:
热变化:硅具有高热光系数,使MRR对温度变化非常敏感。观察到的偏移量为70-100 pm/K。
制程变化:制造挑战导致MRR尺寸变化,使谐振波长偏离设计意图。
这些变化可能导致发射器和接收器MRR之间的不匹配,影响链路完整性。
器件级和设计级缓解技术
在器件和芯片设计层面存在几种方法来解决热敏感性和制程敏感性:
器件级:
使用电阻加热器进行主动热调谐
使用负热光系数材料设计非热敏MRR
将MRR嵌入马赫-曾德尔干涉仪
设计级:
处理器和光电子层的热解耦
光电子组件的热感知布局和布线
图1:多核系统的横截面视图,显示处理器裸片和光电子裸片之间的绝缘层。
这些技术有效,但不考虑运行时工作负载特性。这为系统级管理提供了机会。
系统级管理技术
工作负载分配和迁移
RingAware是一种工作负载分配策略,在通信MRR周围维持相似的功率分布,以最小化热变化的影响。该策略根据核心与MRR的距离进行分类,并分配线程以最小化热梯度。
图2:使用Clustered和RingAware策略的片上最高温度和热梯度。
Therma在此基础上进行了改进,通过运行时线程迁移在整个工作负载执行过程中保持通信MRR周围的相似热活动。
FreqAlign进一步考虑了热变化和制程变化。它不仅维持相似的热活动,还旨在匹配通信MRR的实际谐振波长。
图3:使用(a) Clustered,(b) RingAware和(c) FreqAlign策略时MRR组之间的平均谐振频率差异。每个柱状图对应一个工作负载+系统利用率。
图4:使用(a) Clustered,(b) RingAware,(c) FreqAlign + TFT和(d) FreqAlign + AFT进行热调谐所需的加热功率。
LIBRA结合了反应式器件级技术和主动式系统级线程迁移。根据每个MRR的校准边界温度,动态选择热修整或热调谐。
图5:(a) fluidanimate和(b) radiosity应用程序执行期间的实际温度和预测温度。
功率缩放技术
上述技术侧重于减少热调谐的加热功率,但整体光电子功率还取决于激光功率和电光转换功率。PEARL和WAVES等技术通过动态缩放光学通道来解决这个问题。
PEARL使用粗粒度反应式方法结合主动式机器学习来预测带宽需求并相应地缩放激光功率。
图6:PEARL中动态功率缩放的框架。
WAVES在考虑热变化和制程变化的同时,选择应用程序所需的最少光学信号(波长)数量。它激活最佳波长组合以最小化调谐范围。
PROWAVES通过考虑应用程序执行期间的动态带宽需求来增强WAVES。它使用时间序列预测来预测网络活动并主动选择光学通道。
图7:应用程序执行期间硅基光电子链路中传输的数据包数量。应用程序有数据包传输量较高的阶段和较低的阶段。
图8:PROWAVES的流程。每个时间间隔,ARIMA预测网络活动。将预测值与实际值进行比较以调整模型(如果出现偏差)。线性回归模型使用预测的网络活动选择光学信号。
应用程序级仪器辅助(instrumentation-assisted)
片上通信流量和温度分布也取决于软件实现。应用程序仪器辅助可以为系统级策略提供特权信息,以便更好地决策。
图9:应用程序仪器辅助(instrumentation-assisted)带宽分配技术的框架。
与非仪器(non-instrumented)版本相比,PageRank算法的仪器版本使用WAVES实现了35%更高的光电子功率减少。
结论
硅基光电子网络为大型多核芯片提供了高带宽、低延迟片上通信的有前途的解决方案。然而,对热变化和制程变化的敏感性带来了重大挑战。
本文探讨了各种系统级管理技术来解决这些挑战:
考虑热变化和制程变化的工作负载分配和迁移策略(RingAware、Therma、FreqAlign、LIBRA),以最小化通信MRR之间的谐振不匹配。
基于带宽需求和变化引起的谐振偏移动态调整活跃光学通道数量的功率缩放技术(PEARL、WAVES、PROWAVES)。
应用程序级仪器辅助,为更有效的系统级管理提供额外信息。
这些技术在保持性能的同时显着降低了光电子功耗。随着硅基光电子技术的不断成熟,这些系统级管理方法对于实现具有高性能片上通信的节能多核系统将非常重要。
未来的研究方向可能包括:
探索机器学习技术,以更准确地预测热分布和带宽需求。
研究在工作负载管理中同时考虑计算和通信方面的协同优化方法。
开发标准化的应用程序级插桩接口,以促进变化感知系统管理技术的广泛采用。
通过智能系统级管理解决热变化和制程变化的挑战,硅基光电子网络可以充分发挥2.5D集成多核系统在下一代计算应用中的潜力。
参考文献
[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.
点击左下角"阅读原文"马上申请
欢迎转载
转载请注明出处,请勿修改内容和删除作者信息!
关注我们
关于我们:
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
http://www.latitudeda.com/
(点击上方名片关注我们,发现更多精彩内容)