比利时微电子研究中心计划利用超导缩小计算机

学术 2024-11-16 15:01 北京

可以放在鞋盒中的数据中心。

科学家预测，到2040年，计算消耗的电力将占全球总量的50%。

这一预测是在生成式人工智能爆发之前作出的。过去十多年来，训练大型人工智能模型所需的计算资源大约每6个月就会翻一番。按照这个速度，到2030年，训练一个人工智能模型所需的计算资源将是当前十大超级计算机年度所需资源之和的100倍。简而言之，计算需要的巨大电力能源，很快将超出地球所能提供的范围。

要想解决计算行业不可持续的能源需求问题，从根本上改变计算方式是一个行之有效的方案。超导体可以帮我们实现这一点。

超导体提供了大幅降低能源消耗的可能性，因为在传输电流时，它们不消耗能量。的确，超导体只能低温条件下工作，冷却需要一些开销；但作为交换，它们可以提供几乎零电阻的互连，所具备的基于极短脉冲的数字逻辑只需要极少能量，而且它们易于实现3D芯片堆叠，可以实现惊人的计算密度。

这些优势足以克服低温冷却的成本吗？我们的研究表明，确实能。随着计算资源规模的增长，冷却开销的边际成本变得越来越小。我们的研究表明，从每秒约10亿亿次浮点运算开始，超导计算机在节能方面轻松地超越了传统超级计算机。而这正是当前高性能计算机的运算规模，因此，超导超级计算机的时代已经到来。

过去两年，我们在比利时微电子研究中心（Imec）致力于开发可以使用标准互补金属氧化物半导体（CMOS）工具制造的超导处理单元。由此制成的处理器的节能效率将是当前节能高效芯片的100倍，这种计算机可以将一个数据中心所需的计算资源压缩到一个鞋盒大小的系统内。

超导性是指在足够低的温度下，某些材料能够以零电阻的方式传输电流的能力。这种能力早在1911年被发现，自20世纪50年代中期就出现了将其用于计算的想法。然而，这项技术虽然具有低功耗和高计算密度的潜力，但仍无法与摩尔定律下互补金属氧化物半导体惊人的尺寸缩小速度相媲美。几十年来，这方面的研究一直在持续，2020年，日本横滨国立大学的一个团队展示了一款超导CPU。然而，作为辅助计算，超导仍然主要局限在实验室中。

为了推动这项技术走出实验室，朝着可扩展设计方向发展，并在现实世界中具有竞争力，我们不得不改变自己在比利时微电子研究中心的研究方法。我们没有采用自下而上的方式（从物理实验室中的可行性工作开始，然后推动技术的实用化）来发明系统，而是以自上而下的方式开展设计，即从必要的功能开始，直接与互补金属氧化物半导体工程师和全栈开发团队合作，确保其可制造性。团队不仅研究制造工艺，还研究软件架构、逻辑门，以及逻辑和内存元件的标准单元库，构建完整的技术。

实际上，高效节能计算的基础理念可以追溯到1991年。传统处理器消耗的大部分电力和散发的热量源自信息在逻辑单元之间或逻辑与内存元件之间的传输，而不是来自实际操作。然而，由超导材料制成的互连不会耗费任何能量，这些导线的电阻为零，因此，处理器在内部移动比特时基本不需要能量。这种能量损耗极低的特性即便在非常高的信息交换频率下也是成立的，而在普通互连中，能量损耗会急剧增加。

超导计算机内部的逻辑实现方式也进一步节省了能源。超导逻辑的基本元素不是晶体管，而是约瑟夫森结。

约瑟夫森结就像一个三明治：一片薄薄的绝缘材料夹在两个超导体之间。连接这两个超导体，就形成了一个约瑟夫森结环路。

正常条件下，约瑟夫森结这个三明治中的绝缘“肉”夹层非常薄，不会阻碍超电流，因为整个三明治作为一个超导体来运行。而如果电流超过阈值，即“临界电流”，绝缘材料周围的超导“面包片”就会短暂地脱离超导状态。在此期间，约瑟夫森结会发出一个微小的电压脉冲，仅持续1皮秒、消耗2×10-20焦耳能量，相当于在传统闪存中写入1比特信息所需能量的千亿分之一。

关键在于，超导环路中有一种被称为“磁通量子化”的现象，这使得这个脉冲始终是完全相同的，被称为单磁通量子（SFQ），其值固定为2.07毫伏皮秒。在约瑟夫森结环路内放置一个电感器，电压脉冲将驱动电流。由于环路是超导的，这种电流将在环路中无限循环，且不需要任何的能量。

超导计算机中的逻辑运算是通过操纵这些微小的量子化电压脉冲来实现的。具有单磁通量子持续电流的约瑟夫森结环路表示为逻辑1，而没有电流的环路表示为逻辑0。

为了存储信息，CPU缓存中基于约瑟夫森结的静态随机存取存储器（SRAM）也使用单磁通量子。要存储1比特数据，需要将两个约瑟夫森结环路相邻放置。左侧环路中具有持续电流的单磁通量子是存储逻辑0的存储元件，而左侧没有电流、右侧有电流的环路是逻辑1。

要将实验室概念变成可供制造的芯片原型，我们必须对整套硬件体系进行创新。该体系主要分为3层：基础材料工程、电路开发和架构设计。这3层必须结合在一起：一套新的材料需要新的电路设计，而新的电路设计需要新的架构。3层的协同开发是成功的关键，并且要严格遵守互补金属氧化物半导体制造能力要求。

在材料层面，我们不得不放弃之前实验室常用的超导材料铌。虽然铌易于成型并且在可预测的实验室条件下表现良好，但它很难缩小。铌对工艺的温度和周围材料都很敏感，因此不适用于标准的互补金属氧化物半导体工艺。所以我们改为使用铌钛氮化物作为基础超导材料。铌钛氮化物可以承受互补金属氧化物半导体制造过程中的温度，不会失去超导能力，并且它与周围各层的反应也少得多，是一个更为实用的选择。

此外，我们采用了一种新的材料作为约瑟夫森结的“肉”夹层：非晶硅，或称α硅。传统的约瑟夫森结材料，特别是氧化铝，不能很好地缩小规模。使用铝是因为它能够“润湿”铌，使表面变得光滑，并且氧化物可以在受控良好的条件下生长。然而，为了达到超高密度目标，我们必须使用非常薄的氧化物，这在实际生产中很难实现。而在相同的临界电流下，α硅允许我们使用较厚的阻挡层。

我们还必须设计一种新的方法，为能够缩小到芯片尺寸的约瑟夫森结供电。以前，实验室超导计算机使用变压器向电路元件供电。然而，在每个电路元件旁边放置笨重的变压器是不可行的。为此我们另外设计了一种方法，利用整块芯片上散布的特有电容搭建谐振电路，一次为芯片上的所有元件供电。

在电路层面，我们不得不重新设计整个逻辑和内存结构，以充分利用新材料的能力。我们设计了一种新型逻辑架构，称为“脉冲守恒逻辑”。脉冲守恒逻辑的关键是元件的输入与输出数量相同，并且单磁通量子的总数保持不变。逻辑操作通过约瑟夫森结环路和电感器的组合，将单磁通量子路由到适当的输出，产生逻辑“或”和“与”。为了补充该逻辑架构，我们还重新设计了兼容的基于约瑟夫森结的静态随机存取存储器。

最后，我们必须进行架构创新，充分利用新材料和电路设计的优势。其中包括将传统的硅基动态随机存取存储器冷却至77开尔文，并设计了一个玻璃桥，连接77开尔文区和主超导区。玻璃桥内有细导线，可以在不发生热混合的情况下进行通信。我们还设法将芯片上下堆叠，并且正在开发垂直连接电路板的超导互连。

最终，我们设计出一款为人工智能处理优化设计的超导芯片。放大其中一块电路板可以发现，它与一般的3D互补金属氧化物半导体片上系统有许多相似之处。这块电路板由计算芯片组成，我们将其称为“超导处理单元”（SPU），内置超导静态随机存取存储器、动态随机存取存储器内存栈和开关，所有互连都通过硅插入或玻璃桥先进封装技术实现。

但也存在一些显著差异。首先，芯片大部分都被浸入液氦中冷却至4开尔文。这包括安装在插入板上、依赖于超导逻辑而不是互补金属氧化物半导体的超导处理单元和静态随机存取存储器。然后，有一个玻璃桥通往温度为77开尔文的中温区，这里安放的是动态随机存取存储器。动态随机存取存储器没有采用超导技术，而是采用了传统的硅，由室温冷却下来，使其更加高效。自此，通过定制连接器与室温部分交换数据。

摩尔定律的核心是在同一空间放入越来越多的计算资源。随着晶体管小型化越来越困难，半导体行业正在转向芯片3D堆叠，来保持密度的增加。在基于互补金属氧化物半导体的传统技术中，芯片内部会消耗大量功率并散发热量，将计算芯片上下相互堆叠在一起非常具有挑战性；而在超导技术中，消耗功率很少，热量很容易被液氦消除，逻辑芯片可以使用先进的3D集成技术直接堆叠在一起，实现芯片之间更短、更快的连接，并且占用的空间更小。

要实现这一点，可以直接将多块3D超导芯片板堆叠在一起，之间只留下很小的间隙。我们通过建模对100块这样的芯片板进行堆叠，都在同样的冷却环境中运行，装在一个体积为20厘米×20厘米×12厘米的空间中，大致相当于一个鞋盒的大小。我们计算出这个堆叠可以实现每秒20百亿亿次浮点运算的速度（使用BF16数字格式），这是目前最大的超级计算机的20倍。更重要的是，该系统的总功耗仅有500千瓦，这意味着其能效是目前最高效的超级计算机的100倍。

到目前为止，我们的约瑟夫森结和互连尺寸已经连续缩小了三代。接下来，比利时微电子研究中心的路线图包括解决3D超导芯片集成和冷却技术。对于第一代，路线图设想的是堆叠大约100块板，目标性能达到20 百亿亿次浮点运算。然后逐渐堆叠越来越多的逻辑芯片，同时减少板的数量。这将进一步提高性能，同时降低复杂性和成本。

我们并不认为数字超导技术会取代传统的互补金属氧化物半导体计算，但我们确实希望它能够在特定应用中成为互补金属氧化物半导体的补充，并推动应用创新。例如，这项技术将与基于超导技术的量子计算机无缝集成。或许更重要的是，我们相信它将支持人工智能和机器学习计算量的增长，并以比目前更可持续的方式向大型人工智能模型提供基于云的训练。

此外，借助这项技术，我们可以建设占地面积很小的数据中心。急剧缩小的数据中心可以放置在靠近目标应用的地方，而不必位于一些遥远的、足球场大小的设施中。

这种变革性的服务器技术是科学家的梦想。它打开了用真实数据对人工智能模型进行在线训练的大门。真实数据是急剧环境变化的一部分，以极具潜力的机器人农场为例，如今，训练这些模型是一项具有挑战性的任务，因为所需的计算能力只能从遥远、耗电量大的数据中心获得。而有了近距离的微型数据中心，就可以即刻处理数据，使人工智能了解农场的当前情况。

同样，这些微型数据中心可以散布在能源电网中，在每个节点即时学习，更加高效地在世界各地分配电力。此外，智慧城市、移动医疗系统、制造业、农业等领域也有望从相关人工智能学习者的即时反馈中受益，从而实时优化和改进决策。

作者：Anna Herr, Quentin Herr

IEEE Spectrum

《科技纵览》

官方微信公众平台

往期推荐

探索DNA数据驱动器

利用大数据提高机器人的能力

新光纤技术打破数据速率记录

http://mp.weixin.qq.com/s?__biz=MzI3NjUyMTgxNQ==&mid=2247553923&idx=1&sn=5e60ddfd0d0d9f3f280518a1acbadf84

悦智网

IEEE Spectrum是国际期刊界卓越的技术写作和报道的一盏明灯。我们旨在提供一个跨学科技术领域的“全局”，让读者了解工程学、科学和技术领域的创新成果与发展趋势。

最新文章

遵循摩尔定律的机器

我们敢将生成式人工智能用于解决心理健康问题吗？

意识是一种模拟状态，它只能存在于梦中，而不是在物理世界中

第十八届中国青年科技奖正式揭晓

科学家制造首个机械量子比特

如何从零开始打造芯片产业

2024年全球高被引科学家名单出炉！

太阳究竟花了多久才形成？

雷达猫咪探测器

Science | 浙江大学：高效生长铝纳米线森林的新技术！

人形机器人的兴起

印度初创公司在72小时内打印出火箭发动机

电动汽车的未来发展

湖南大学/河北师范大学合作，Nature Nanotechnology！

激光雷达芯片进入发展快车道

比利时微电子研究中心计划利用超导缩小计算机

效仿芯片制造的血糖监测仪

3所高校，新晋ESI前万分之一

海洋封存碳的速度比以前想象的要慢

首次在液体中发现热电效应

测量时间和空间的畸变

生成性人工智能的未来发展

这位工程师负责欧洲核子研究组织的粒子加速器正常运行

提高天基功率的一种方法：继电器

西湖大学，Nature Materials！

ARTEMIS：卫星导航电离层精准监测助力北斗高精度应用

毫米波或许不是最有前景的6G频谱？

武汉大学/北京大学合作， Science！

风电制氢技术走向海洋

被遗忘的中文键盘史

反应堆燃料可用于核炸弹

北京理工大学，Nature！

生成式人工智能带来的电子废弃物垃圾不容忽视

人工智能在心智理论测试中战胜人类

2mm芯片植入视网膜，盲人重获阅读能力

华北电力大学，首篇Science！

北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！

民勤盐渍农田磷肥利用状况与科学施肥对策建议（项目咨询报告）

睡眠可以修复心脏

以太坊智能合约安全漏洞检测

复旦大学，Nature！

新型载液使氢气更容易运输

超人的速度！自主驾驶无人机击败最优秀的人类选手

新能源汽车电磁安全测评技术

苹果最强芯M4 Max首发！新MacBook Pro顶配57099元

中国科学院最新Nature！

AI-HIFU人工智能超声无创手术机器人——引领人工智能无创伤外科医学新纪元

国自然基金重大调整，这4点需要关注！

新型混合存储器旨在减少人工智能的能源使用

芯片扩展中的摩尔定律

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉