DRAM遇到了“内存墙”

科技 2024-11-17 15:58 美国

世界越来越质疑摩尔定律的消亡，但悲剧在于，它在十多年前就已经消亡了，只是没有大张旗鼓。

相比逻辑上，但摩尔定律也一直适用于DRAM。

DRAM不再缩放。在辉煌的年代，内存密度每18个月翻一番——甚至超过了逻辑。这相当于每十年密度增加100多倍。但在过去的十年里，缩放速度如此之慢，以至于密度只增加了2倍。

现在，随着人工智能的爆炸性增长，该行业的平衡进一步受被打乱。虽然随着时间的推移，逻辑芯片在密度和每个晶体管的成本上都有了显著改善，但DRAM速度的提高却很慢。尽管FUD很大，但台积电的3纳米和2纳米工艺节点的每个晶体管成本继续下降。

而对于内存，带宽的增加是由昂贵的封装驱动的。

高带宽内存（HBM）是加速器内存的核心，per GB的成本是标准DDR5的3倍或更多。客户被迫接受这一点，因为如果他们想设计一个有竞争力的加速器，几乎没有其他选择。这种平衡是不稳定的——随着层数的增加，未来的HBM世代变得更加复杂。

随着模型权重接近TB规模，人工智能内存需求正在爆炸性增长。对于H100来说，约50%以上的制造成本归因于HBM，考虑Blackwell这一比例到~60%以上。

换句话说，DRAM行业遇到了障碍。算力改进虽然速度变慢，但远远超过了内存。DRAM的创新步伐如何重新加快——以及未来可以利用哪些创新来提高带宽、容量、成本和电力使用？

数千亿美元的人工智能资本支出，该行业有强大的动力推动这些解决方案向前发展。

DRAM入门

计算机中使用的内存有几种类型。最快的是SRAM（静态随机存取存储器），它与逻辑处理器工艺兼容，位于CPU或GPU上。由于它在逻辑芯片上，SRAM也是最昂贵的内存类型——每字节比动态随机存取存储器（DRAM）贵约100倍以上——因此仅少量使用。另一端包括非易失性NAND固态驱动、硬盘驱动和磁带。这些很便宜，但对许多任务来说太慢了。DRAM位于SRAM和Flash之间——足够快，足够便宜。

DRAM可以占非人工智能服务器系统成本的一半。然而，在过去的10年里，它是所有主要逻辑和内存中规模增长最慢的。16Gb DRAM芯片在8年前首次大量提供，但今天仍然是最常见的；推出时，它们的价格约为每千兆字节3美元。目前，功耗得到了最好的改善，这主要是由于LPDDR的兴起。DRAM缺乏进展是阻碍计算的性能和经济的瓶颈。

数字芯片实验室

前瞻性的眼光，和持之以恒的学习。

最新文章

SerDes技术：数字时代的“数据快递员”，让通信又快又稳

我是芯片后端工程师，也是一个在纳米世界里修桥的人

芯片验证：在代码的裂缝中寻找光

半导体行业暗战升级：台积电、AMD、英特尔如何破局？

数字芯片设计中的X传播挑战及应对策略

deepseek协助生成芯片验证的feature list是完全可行的

[文章分享]验证只读寄存器的挑战与解决方案：一种灵活的检查机制

当“开源DeepSeek”遇上“双标OpenAI ”：一场AI巨头的行为艺术

用统一测试平台搞定多版本PLL验证，省时又省力

跨越异步时钟域的智能同步器设计实践

搞芯片的兄弟们，有个宝藏论坛再忙也得收藏！

为什么每个芯片工程师都应该关注SemiEngineering

混合信号验证新利器：UVM-MS 1.0落地指南

如何把混合信号验证塞进数字测试平台？惠普工程师的实战心得

【文章分享】Accelerating CDC Verification Closure on Gate-Level Design

藏在智能设备背后的千亿战场：物联网芯片正掀起一场静默革命

全球AI烧钱大战升级！巨头狂砸万亿，"小力奇迹"能否逆袭？🤖

芯片数字后端工程师：藏在代码背后的“造芯匠人”

走进芯片数字设计工程师，探索科技背后的坚守

走进芯片验证工程师，Deep Seek 也有“职业感悟”

美光在新加坡的大动作！投资 70 亿建 HBM 先进封装厂，2026 年开启运营

【假如你是个搞芯片的】

[文章分享] 一种解决跨时钟域中false path约束隐藏时序风险的新方法

DeepSeek仿《劝学》体作《劝芯篇》

中国芯片行业从业者：如何在这个快速变化的领域保持竞争力？

集成GPU和独立GPU，到底谁更厉害？

可能被人工智能取代的6个岗位

在未来25-50年内，人工智能将取代哪些工作？

从鸡蛋战争到字节序大战：用小人国的故事讲明白大端小端

中国的Deepseek AI是否表明美国对OpenAI的投资很傻！

人工智能可能会取代平庸的软件工程师和IC工程师

芯片圈的老铁们，过年好哇！

【技术闲聊】CPU缓存要过时了？未来这几种黑科技可能让它下岗！

【技术解析】IOMMU：让硬件设备也能“看懂”内存的翻译官

中国AI这次真的玩大了！硅谷大佬们集体傻眼…

用DeepSeek 生成了一篇公众号文章：【颠覆认知】没有CPU的电脑能运行？GPU真能单挑大梁？真相让你惊掉下巴！

每一行代码终将成为“屎山”

指令集和微架构有什么区别？

芯片届考古学，反向也是一门艺术

计算机史上最重要的CPU技术突破

什么是RTL Signoff

GPU适合处理什么样的程序

发现书籍系列:Synthesis of Arithmetic Circuits

为什么需要直接内存访问DMA?

这可能是半导体行业最令人兴奋的突破

为什么美国不能制造与台积电一样先进的芯片？

基于FPGA构建的CPU与传统CPU有何不同？

计算机系统中有用户模式user mode和内核模式kernel mode的目的是什么？

我们什么时候可以用到比2nm和1nm更小的半导体工艺

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉