鸽了许久,本系列终于迎来本系列的第二期了。作为2024开年的第一篇推送,我们聊聊Intel的另一个传奇工艺节点14nm。这里依然重复一下本系列文章的定位是尽可能的将每个节点的必要信息放在一起,结合一些官方或者权威数据进行计算。虽然可能有误差,但是已经尽可能保证数据准确了。另外注意下,本猫无EE方向学习从业经历,仅作为民科进行资料整理。
建议提前阅读第一期:工艺百科-Intel 10nm篇:疯狂到极致就是翻车
01
总体概览
Intel的工艺一直遵循着类似Tick-Tock的更新模式,一般两个工艺节点组成一组,其中一个节点会引入大量新技术,而下一个节点则是只进行打磨和微缩。我们知道Intel的22nm是引入FinFET的关键节点,那么14nm自然主要是在22nm 基础上进行打磨和微缩,并引入了第二代FinFET工艺(又名Tri-gate)。
Intel的工艺一直遵循着类似Tick-Tock的更新模式,一般两个工艺节点组成一组,其中一个节点会引入大量新技术,而下一个节点则是只进行打磨和微缩。我们知道Intel的22nm是引入FinFET的关键节点,那么14nm自然主要是在22nm 基础上进行打磨和微缩,并引入了第二代FinFET工艺(又名Tri-gate)。
虽然Intel的14nm没有引入关键技术的更新,但在微缩方面还是十分激进的,官方第一版的数据中,14nm对比22nm密度提升了2.45倍(注意下,14nm的密度实际上存在两个说法,Intel可能后期修正了计算方式,统一标准的详见表格)。这个密度提升的速度不但远超TSMC、三星的代际提升,也比摩尔定律中的2倍要高。
不过Intel 的14nm提升那么多只是为了还账而已,不用夸Intel。我们一直都说Intel的工艺水分小,但实际上是从14nm开始才没水分,而在14nm之前Intel的工艺密度一直小于台积电的同节点。
02
特征尺寸
Intel的14nm前后总共有两个设计规则,14++前为第一版,随后的均为第二版。无论是哪个版本,都在理论上有超高性能UHP、高性能HP、以及高密度HD三种密度库设计。
从Intel 14nm 初版的逻辑晶体管设计规则来看,Fin Pitch从22nm的60nm缩小到了42nm,CGP从90nm缩到了70nm,M2对应的MMP则是52nm(M0是56nm),HD单元高度也从22nm的840nm下降到了399nm。总体而言,这些设计让14nm对比22nm缩小了到了大约0.37X的尺寸,远高于代际的标准0.5X。
除了逻辑晶体管的微缩以外,Intel也公布了一些其他指标上的微缩。在SRAM面积上,大约减小到了0.54X,在IO面积上减少到了0.60X。所以最终按照逻辑:SRAM:IO 60:25:15的比例来计算,整个芯片的面积可以缩小到0.459X,显著高于之前的工艺提升。这里也顺带重复一下,一个芯片里基本包含逻辑、SRAM、IO三种晶体管,三种晶体管里只有逻辑晶体管最容易微缩,而我们一般说的密度也都只是逻辑的。
综合上面几个尺度,可以看到如果继续使用193nm 浸润式光源的方案,那么极限的MMP是在80nm不到,显然是无法满足14nm的生产的。为此,Intel在14nm上引入了SADP,也就是自对准双重曝光(其实应该叫做自对准双重套刻,不过习惯了这个程度就这样吧)。根据从Intel官方口径的核对,Intel 的 14nm应该是第一个引入SAQP的工艺。在此之前可能有双重曝光(LE2、litho-etch-litho-etch ),但并不是SADP。
在初版14nm设计之后,Intel在2017年的Coffee Lake上引入了下一版的14nm 14++,在CGP部分从70nm放宽到了84nm,其它不变或者没有被提及。放宽CGP后,让新版的14nm在0.7V下对比初版提升了20%+的性能或者功耗减半。不过对比已经打磨过一次的14+来说,2017年的14++提升并没有那么显著。此外,从Intel官方的成绩来看,Intel的初版14nm在性能上是不如台积电的16FF+的(也就是Kaby Lake之前的都不如,从Kaby Lake开始的14nm才是打磨成熟的)。
初版14nm最迷惑的地方在于密度到底是多少?上面Intel的官方图中是37.5 MTr/mm2附近,但是后面很多权威的出处都修正为44MTr/mm2,而根据公式计算出来的也的确是44附近,因此我们只采用44这个。但是,如果说是看14++,那么37.5倒是十分贴合了。
总结一下,Intel在14nm上的密度提升确实相当给力,一举解决了之前工艺注水的问题,从14nm开启了老实人的身份。从这里也能看出,14nm在密度上的追求很高,再加上SADP的引入也直接导致了14nm难产了一年,且不成熟了一年。理论上,14nm应该在2014年底就出来,结果是2016年的Kaby Lake才算真的出山。
03
关键技术
我们之前说过14nm是22nm的微缩版,所以14nm并没有引入太多的关键技术。但是毕竟有那么激进的微缩,所以还是有一些打磨在这里的。最明显的可以分为:1、FinFET的改进。2、各种材料结构的改进。3、SADP 自对准双重曝光。
先说说FinFET晶体管。14nm的第二代FinFET晶体管,对比22nm的第一代FinFET晶体管更高更瘦。如上图,平面晶体管的Gate只有能包围通道的一面,FinFET的Gate是包围通道(即Fin)的三面,GAA的Gate则是四面包围通道(Sheet或者Wire,不过现在都是Sheet)。
无论这里的通道(沟道)叫作什么,他们在尺寸上有两个特性。其一,通道的总体积越大,则能承载的电流越多,更容易实现高性能。其二,Gate包裹通道的程度(粗略可以看Gate环绕Fin的三个长度和,上面的黄线部分)越大,那么控制能力越强,更不容漏电。
那么可以看到说14nm的Fin做的更高有助于增加承载电流的能力并增加性能,而更高和更瘦同时也会增加Gate的包裹程度,实现更好的控制能力。对应到理论性能部分,Intel并没有披露太多关于14nm的性能改进,大约只说了首发14nm的Core M(Broadwell Y)大约实现了两倍的能耗比。从实际的情况来看,首发的14nm的确在低功耗段有很大优势,不过在桌面对应的高性能部分有点问题,具体我们下一节说。
在小的结构和材料改进方面,大家看上面的图就可以,不太懂也就不试图去解释为什么了。而SADP的话,严格说这不算晶体管层面的创新,反正前面也说过我们之后文章再详细聊(或者找之前的光刻文章工艺杂谈:EUV被封锁的情况下,DUV工艺的极限是多少?)。
04
14nm有多少个版本?
虽然Intel明面上只给14nm安排了三个变种,并且只有14++才发生了晶体管设计的变化。但实际上14nm的版本众多且发生了晶体管变化的不止14++。所以,太过细节的东西我们不可能得知(就像现在14nm的M2P是多少都没人说),这篇文章尽可能按照官方的思路去给大家说。
第一代14nm:不成熟的14nm
在延期几个月后,14nm的第一代产品首发于第五代酷睿Broadwell,2014年底先有Core M,然后15年有笔记本端的普通Core。这个14nm的高频性能衰退很严重,2015年的Broadwell-R最高3.7G,隔年的Broadwell-E 最高3.8G,即便超频过了4.0G也不太稳,远不如当时的22nm。
第二代14nm:依然不成熟的14nm
Intel 在2015上半年发布Broadwell后,紧接着也在下半年发布了著名的Skylake。Skylake身上的14nm虽然没有改名字,但是显然已经打磨过了。6700K的频率虽然依旧不如4790K,但是已经基本和末代22nm差不多了。
第三代14nm:成熟体的14nm
Intel 在2016年发布了Skylake的二代马甲Kaby Lake,除了修正了核显的Bug后,工艺也提升到14+。Intel并没有提及此次晶体管的改变,但是有分析指出Fin做了进一步改良(参考文末小插曲)。而在性能上,14+的7700K也终于超过22nm站了起来,因此我定义为成熟体的14nm。
第四代14nm:罪恶起始的14++
Intel 在2017年发布了Skylake的三代马甲Coffee Lake,核心数从4上升到6,并且首发了14++。Intel官方说明了此次的14nm的CGP从70nm抬高到了84nm。理论上,这个改变会降低密度但可以提升性能。实际情况下,性能的确提升,但是密度没有显著下降。个人猜测这可能是因为Intel本来就在物理设计上的很宽松。
为什么说14++是罪恶的起始呢?因为从此以后,Intel已经不好意思再用+号去标注工艺的区别了,但是工艺又明显一直在改进着。
第N代14nm:14不知道几个+
自2017年的Coffee Lake后,Intel又陆续发了N代14nm的处理器。并且这个时候我们已经很难去鉴别到底改进了多少了?大致只能观察下能耗还有频率的改进。所以我就全部打包一起说吧:
2018年发布了Skylake的四代马甲Coffee Lake Refresh, 也就是9代酷睿,核心数目进一步提升到8核心。
2020年发布了Skylake的五代马甲Comet Lake,也就是10代酷睿,核心数目提升到了10核心。
2021年发布了Icelake的14nm Backport版Rocket Lake,也就是11代酷睿,核心数目退回到了8核心,但是换上了全新的Cypress Cove核心(Sunny Cove的马甲)。
由此可见,从8代酷睿到11代酷睿的四代产品,Intel说的都是用14++,我们真的很难去评定性能如何。
05
性能功耗篇
Intel 14nm各个版本的性能是比较难估计的,Intel前后给了不一样的答案。在最开始的时候,Intel宣称14++比起14nm在0.7V下提升了26%的性能,并且降低了52%的功耗。随后又在10nm SuperFin发布的时候,展示了一个14nm各个版本的性能对比,这里的进步幅度就小了很多。
综合各方面考虑,我觉得后面10nm SuperFin发布时候的那个参考意义更大一些,因为那时候的10nm提升数据也相对准确。而对于Intel的工艺来说,0.7V位置也的确没啥太大参考意义。最后整理的具体数据如下:
在综述表格中,14nm的每个版本基本提供3%的性能提升或者6%的功耗下降。在对比最初版和最终版的14nm中,大约ISO功耗下降35%或者性能提升22%,此外极限性能提升39%。注意这里的ISO功耗/性能提升那里可能有点保守,应该不适合于高频的比较。反正如果以后能找到更好的计算方式,我再更新就好。
06
总结:从辉煌到落魄的14nm
Intel 14nm的传奇之处在于其超长的生命周期(其实也包含Skylake):
Intel 14nm 在2014年末尾登场,那时候台积电是20nm。
台积电很快跟随三星注水推出16nm,AMD也推出GF14nm的Zen1,Intel 还是14nm。
台积电2年后推出了N10,Intel还是14nm。
台积电1年后推出了N7,AMD接连推出Zen2和Zen3,Intel还是14nm。
虽然14nm/Skylake的理论规格在当时2014年很强,但是真的耐不住时间。在整整7年间,Intel的10nm都无法成熟,而友商都在不断进步。最终,Intel的14nm出生的高贵、走的悲凉,活脱脱一个Intel衰败史。在14nm当道、10nm挣扎的这些年里,Intel放任AMD从不成熟的Zen 一步步打磨出自己至今都难应付的大杀器Zen 3,也错过了AI时代的浪潮,让Nvidia夺取第一的宝座。
如果Intel没有“Real men have fabs 真男人有工厂”的情节,那么大可和AMD一样去做一个Fabless找台积电代工。但是每一个有追求的人或者公司,谁不想核心技术都在自己手上呢?自己的才是自己的,别人的都是别人的。
下一期,我们应该可以聊聊Intel的5N4Y了,也就是4年5个节点(Intel 7 4 3 20A 18A)了. 再次给一个第一期传送门:工艺百科-Intel 10nm篇:疯狂到极致就是翻车。
07
小插曲
1.Intel在14nm时期其实就考虑过做代工了,有一个叫做Intel Custom Foundry的部门,并且还设计了14GP(General Purpose)以及14LP(Low Power)两个工艺。 实际客户有没有不知道,但是Intel收购的英飞凌有且仅有一次的用了14nm造4G基带给iPhone,也算是半个代工了。后来也根据这个名称画了一个10nm代工的大饼,然后一起泡汤黄了。
2.时至今日,Intel的IDM2.0战略又重新提起了代工,Intel Foundry Service。14nm也和22nm结合出了22FFL,然后又基于22FFL打造出了Intel 16的工艺,成为IFS的一个重要产能。Meteor Lake的Foveros Die就是22FFL的一个特殊版本。
3.Intel 其实有偷偷摸摸修改晶体管规格的做法,在即将成文的时候,发现Kaby Lake的Fin其实参数不一样了。不过已经不方便改了,Intel也从不说,就那样吧。;
08
相关引用
1. Intel 官方14nm 介绍
2. 22nm FFL 资料 via WikiFuse
3. 10nm介绍 via WikiFuse
4. 14nm晶体管实际扫描分析
扫描二维码
关注&加群
MebiuW
点亮 ,告诉大家你也在看