新高 vs 砍单

文摘   2024-10-15 20:49   上海  

1. NV CoWoS上调

2. AMD砍单?

3. 2026年的问题到底如何回答


1. NV上调CoWoS

昨天NV收盘新高。星球更新了NV CoWoS后,收到很多反馈。英伟达上调到40多万片,其实并不夸张,最开始NV跟T要的数字更高(5开头,很接近6...)台积打了个大折,初步给的是30多万,再加一部分弹性(加价买更多)。而最近,随着台积电对群创Innlux的收购,由于一次性获得了巨大的clean room,可扩产潜力大幅提升...随之各个sellside开始上调25和26年的cowos总量,同时把台积2025年capex forecast抬到40Bn。

那么问题来了,TSM向来对产能规划是非常小心的,谁给TSM扩产的信心,AMD?TPU?其他ASIC?不可能的。只有NV。而NV的需求可见度至少在2025年H1之前是非常高的。为此,今天刚问了M公司的北美大哥,他的意思“现在算力需求依然很大,25H1之前Capex看不到放缓”。但之后呢?可能大家都要走一步看一步。

因此这两天大家都在讨论HTI Jeff给出的464k的cowos,其实也不夸张...现在没到,说不定明年就到了...


2. AMD砍没砍?sooner or later...

也是昨天星球发了之后,来了一堆反馈。不管砍没砍,MI300注定已经成为最短命的加速卡(加速退休卡...)软件调优这些问题先放一边,就看H100这价格。半年前H100是MI300的1.5倍(2.2万美金 vs 1.5万美金),到今天如果价格接近,客户有什么理由继续买MI300?甚至MI325也只是过渡产品,AMD真正的押宝在MI350X,但如果对比下两家的pipeline(如下图),MI350一款产品要抗住NV一个序列...

这里面有个核心问题,NV的推理成本降低,是靠系统提升带来的(拆成多个因子分段提升),相当于5个发动机,而AMD现有方法很粗暴——怼HBM。单发怎么追5发...到了明年差距只拉更大。客户很现实,单位美元买到的推理性能,如果贵10倍,凭什么买?而收购ZT带来的效果,还不知能否在MI350上看到。


3. 2026年需求的问题:PMF?

显然,连NV自己都在考量2026年的问题。为HBM禁令的事儿,今天问了一位NV大哥,他的意思是,CN的事儿不太重要了,毕竟只有那么一点占比,NV现在最关心的也是需求而需求的问题也很明了,训练撑不起2026的增长,需要推理。

这里面的核心问题,就是NV持续在定义超大节点,这件事和2026甚至2027年的推理,是否实现了PMF product market fit...而老黄昨天在BG2上的播客传达了两个他自己的认知:“test time compute会让单次推理所需算力以百万倍增长”(他自己念出了Billions,咱先放一边...),其次,“百万卡不一定是一个cluster,可以是分布式”。因此NV在构思的未来推理算力场景是:超节点+分布式。我们前天的文章也提到,推理成本的本质是带宽成本,而超节点达到了3个极致,功率密度极致、算力密度极致、带宽密度极致当然,读者中很多创业者,他们对这个问题有不同答案,也欢迎大家去星球继续辩论。但从股价来看,华尔街已经选择了,再次相信老黄...

涉及报告已传星球,星球近期的内容、讨论还是很精彩的...

信息平权
理性 客观 朴素