公开课预告
一、DRAM 困境 1.3D DRAM革命的赢家和输家 2.DRAM入门:工作内存 二、DRAM架构及发展历史 1.DRAM入门:基本架构解析 2.DRAM入门:历史回顾 (DRAM 尚可缩放的时代) 3.DRAM基础知识:DRAM扩展停滞时期 三、DRAM扩展的短期策略 1.短期扩展策略:4F²布局与垂直沟道晶体管(VCT) 四、当前DRAM类型及优劣势分析 1.DRAM基础知识:主要DRAM类型 五、HBM发展路线及未来趋势 1.HBM发展路线图 2.HBM础知识:HBM定制 六、新兴内存技术 七、存内计算 (CIM) 1.存内计算: 基本概念 2.存内计算:释放存储体的潜能 3.存内计算:挖掘DRAM的全部潜能 4.存内计算:前进路径与潜在赢家 八、3D DRAM技术 1.3D DRAM:基础知识 2.3D DRAM:挑战者 3.3D DRAM:三大巨头 4.3D DRAM:制造与设备
DRAM密度增长停滞,已成为计算性能发展的瓶颈,AI对HBM的需求加剧了成本和制造难题。 电容器和感测放大器面临物理限制,DRAM缩小面临极高的工艺难度。 HBM虽然是AI加速器的首选,但高成本、容量和扩展性问题限制了其长期应用。 新兴内存技术如FeRAM和MRAM,尽管有潜力,但因成本和技术限制,短期内难以挑战DRAM市场主导地位。 3DDRAM的制造转向先进刻蚀和沉积工艺,推动设备制造商的技术创新和行业进步。 存内计算(CIM)将有望突破传统DRAM架构的效率瓶颈,释放其潜力。 3DDRAM通过垂直堆叠突破扩展瓶颈,结合CIM技术将进一步提升性能。
DRAM:是一种易失性存储器,其基本存储单元由一个晶体管和一个电容器(1T1C)构成。晶体管控制对存储单元的访问,而电容器则以电荷的形式存储信息。由于电容器存在电荷泄漏问题,DRAM需要定期刷新以维持数据完整性。DRAM的核心架构包括: 存储单元阵列:按网格状排列,每个单元存储一位信息。 WL:连接同一行的所有存储单元,控制每一行的访问晶体管。 BL:连接同一列的所有存储单元,与访问晶体管的源极相连。 感应放大器(SA):用于检测来自存储单元的微弱电荷并将其放大至可用强度。 DRAM的扩展在近年来遇到了瓶颈,主要体现在以下方面: 电容器:对图案化和多层薄膜沉积的工艺要求极高。 感应放大器:随着尺寸缩小,其敏感性降低,更易受到变化和泄漏的影响。 SRAM:是一种易失性存储器,与逻辑工艺技术兼容,通常集成在CPU或GPU上。由于其制造成本高昂,SRAM通常仅用于小容量的缓存等应用。 NAND闪存:是一种非易失性存储器,其成本低廉,但速度较慢,主要用于大容量存储应用,例如固态硬盘。NAND闪存已成功实现了从水平布局到垂直堆叠的3D结构转型,其层数已从最初的32层发展到目前的近1000层。 HBM:是一种高性能DRAM,其特点是超宽的总线宽度和垂直堆叠的存储芯片。HBM主要用于AI加速器等对带宽和能效要求极高的应用。HBM的核心特点包括: 超宽总线:单个HBM芯片的I/O总线宽度为256位,远高于其他DRAM类型。 垂直堆叠:多个HBM芯片垂直堆叠,通常为8层或更多,以提供更高的带宽和容量。 TSV:通过硅通孔(TSV)用于连接堆叠的芯片,实现电力和信号的路由。 HBM的高成本主要源于堆叠芯片和TSV的复杂性,其良率也是一大挑战。 DDR5:是一种高容量DRAM,通常以DIMM的形式封装。DDR5主要用于服务器等对容量需求较高的应用。 LPDDR5X:低功耗DDR5增强版(LPDDR5X)是一种低功耗DRAM,适用于对功耗敏感的移动设备和笔记本电脑等应用。LPDDR5X的容量受到与CPU连接距离和电容的限制。 GDDR6X:图形双倍数据速率6代增强版(GDDR6X)是一种高带宽DRAM,主要用于游戏GPU等图形应用。GDDR6X具有较高的延迟和功耗。 FeRAM:铁电RAM是一种非易失性存储器,其存储单元使用铁电材料代替传统的电介质材料。FeRAM具有非易失性、高耐久性和低功耗等优点,但其制造 成本较高。 MRAM:磁阻RAM是一种非易失性存储器,其存储单元利用磁性隧道结(MTJ)来存储数据。MRAM具有非易失性、高速度和高耐久性等优点,但其密度和成本仍有待提高。 CIM:存内计算(CIM)是一种将计算功能集成到DRAM芯片中的技术。CIM的目标是通过将控制逻辑与存储单元靠近,减少数据传输的延迟和能耗。 3D DRAM:是一种将DRAM存储单元垂直堆叠的技术,其目标是通过增加层数来提高存储密度。3D DRAM的制造工艺与传统的DRAM不同,其重点从光刻转向刻蚀和沉积。3D DRAM的核心特点包括: 垂直堆叠:DRAM存储单元垂直堆叠,而不是像传统DRAM那样水平排列。 高纵横比结构:制造过程中需要刻蚀和沉积高纵横比的孔洞和通道。 混合键合:可用于将CMOS电路与存储单元堆栈连接。 3D DRAM的制造工艺对刻蚀和沉积设备提出了更高的要求,预计将推动相关设备市场的增长。
1T1C存储单元:现代DRAM的基础,由一个晶体管和一个电容器构成,每个存储单元存储一位信息,晶体管控制对存储单元的访问,电容器以电荷形式存储数据。由于电容器会发生电荷泄漏,因此需要定期刷新以维持数据完整性。 Wordline:连接DRAM存储单元阵列中同一行的所有存储单元。当一条Wordline被激活时,该行中所有存储单元的访问晶体管都会开启,允许数据在Bitline和存储单元之间传输。 Bitline:连接DRAM存储单元阵列中同一列的所有存储单元,并与访问晶体管的源极相连。当Wordline和Bitline同时被激活时,只有位于两者交叉点的存储单元才能进行数据的读写。 感应放大器(Sense Amplifiers, SA):由于DRAM存储单元的电容值极小,读取时产生的信号非常微弱。Sense Amplifier位于Bitline的末端,用于检测这些微弱信号并将其放大至可识别水平。此外,Sense Amplifier还参与了DRAM的刷新过程,在读取数据的同时,将刷新后的数据重新写入存储单元。 存储体(Bank):DRAM构建的基本单元,由多个子存储体(Sub-Bank)组成。每个子存储体包含一定数量的存储单元,例如8k行x8k位。每次激活和刷新一行存储单元,但I/O操作只能传输其中一部分数据,例如256位。单个Bank的峰值读写能力可达到256Gb/s,但实际性能受限于接口瓶颈,远低于理论值。 刷新(Refresh):由于DRAM的存储电容存在电荷泄漏问题,因此需要定期进行刷新操作以维持数据的完整性。刷新操作会读取存储单元内容,将Bitline电压调整至理想水平,然后将刷新后的数据重新写入电容。该过程完全在DRAM芯片内部进行,无需外部数据参与,最大限度地降低了能耗,尽管如此,刷新操作仍消耗DRAM总功耗的10%以上。 4F²布局:一种DRAM存储单元布局方案,其单元面积以最小特征尺寸(F)的平方来表示。4F²布局的单元尺寸仅为传统6F²布局的2/3,理论上可提高30%的密度,但实际效益可能低于理论值,受其他因素限制。4F²布局需要采用垂直沟道晶体管(VCT)。 6F²布局:自2007年以来DRAM主流的存储单元布局方案,单元尺寸比4F²布局更大,密度更低。 垂直沟道晶体管(VCT):一种新型晶体管结构,其源极、通道和漏极垂直堆叠,而非传统晶体管的水平排列。VCT的占地面积更小,能够满足4F²布局对晶体管尺寸的要求,但制造工艺更为复杂。例如,Samsung在其VCT制造工艺中采用了晶圆键合技术。 硅通孔(TSV): 在芯片内部垂直方向穿透硅晶圆的导线技术,用于实现芯片内部不同层级之间的互联,广泛应用于HBM等高性能封装技术。 UCIe: 芯片互连标准,旨在实现不同芯片之间的高速互联,可用于提高DRAM与其他芯片之间的通信效率。 混合键合(Hybrid Bonding): 先进的芯片封装技术,能够实现芯片之间更紧密的互联,有助于提高芯片性能和降低功耗。
01 DRAM困境
02 DRAM架构及发展历史
03 DRAM扩展的短期策略
04 当前DRAM类型及优劣势分析
05 HBM发展路线及未来趋势
06 新兴内存技术
07 存内计算(CIM)
08 3D DRAM技术
—END—
点击下方名片
即刻关注我们