周期
共找到 6 条记录
文摘   2024-12-08 23:37   浙江  
TL;DR对于一个长期搞电信级设备的渣B, 来谈谈Nvidia下一代Rubin如何能够做到288卡的ScaleUP互联.其实在介绍Blackwell的架构时已经写过一篇文章 ...
文摘   2024-12-07 15:20   重庆  
AWS Re:Invent CTO专场[1], Werner Vogels博士并没有发布任何新的产品, 而是把他入职亚马逊20年的宝贵的经验和教训分享出来, 当复杂性是不可 ...
文摘   2024-12-05 00:34   重庆  
先谈谈大模型发布和GenAI场景其实最近两年一直有一种声音, AWS在GenAI上落后了, 但是昨晚AWS Re:invent的第二场发布会, 似乎有些后来居上的感觉. 除 ...
文摘   2024-12-04 00:02   浙江  
AWS Re:invent 2024开幕之前惊爆一个大消息, 樱桃CEO Pat老先生被董事会退休了, 回望过去几年本来期待樱桃的GPU能够重返江湖像i740那个年代和NV ...
文摘   2024-12-03 07:37   浙江  
TL;DR最近Mooncacke KV-Cache为中心的分离式大模型推理架构开源(github.com/kvcache-ai/Mooncake)了, 看了一下README ...
文摘   2024-12-01 19:10   浙江  
看到一篇晚点的文章《中国大模型生存战:巨头围剿,创业难熬》, 来谈谈个人的一些看法吧, 此文与作者所任职的公司无关, 仅代表个人观点.1.创业公司和大公司的攻守大模型的竞争 ...
zartbot
随便记录点有趣的东西
 热门文章