最近随着 Deepseek 刷屏,大家又展开了一轮关于算力到底是少了还是多了的讨论。要我说啊,其实大家都远远低估了这个玩意儿所带来的长期影响和长期的算力需求。We always overestimate the change that will occur in the next two years and underestimate the change that will occur in the next ten. Bill Gates
我们总是高估未来两年会发生的改变,而低估未来十年的改变。 比尔.盖茨
我说个简单的事情,DS-R1 去蒸馏 Qwen 的 14B 模型,只需要 9.x G的显存就可以在本地跑起来推理……
墨问大体老师的雄文:
DeepSeek出现意味着算力的过剩?
我谈DeepSeek时到底在谈什么