随着DeepSeek的热度持续发酵,发现智算圈的朋友都在讨论一个问题,“DeepSeek对智算中心存量&增量市场有何影响?”从“推理侧算力”角度大家能达成共识的,主要得益于DeepSeek的高性能、低成本和开源特点能够加速AI应用和智能体在众多细分场景下落地,能够“缓解”目前推理侧算力闲置的问题。
但针对“训练侧算力”目前市场上有两种声音:一种是“DeepSeek会导致H系列大集群算力需求减少”,逻辑是DeepSeek在算法方面创新大幅提升了算效比,打破了老美主导的“算力为王”路线,进而千卡、万卡甚至十万卡的集群就不再是刚需,存量市场没客户,新建项目或被叫停,另一种观点是“DeepSeek开了个好头”,目前头部大模型公司全靠资本主导(烧钱),动辄十几亿到几十亿,DeepSeek在模型训练侧的创新会是一个分水岭,引发国产大模型领域“百花齐放”,虽然模型训练所需的门槛低了,但是玩家“数量”上来了,需求总量不降反升,老张更倾向于第二个观点,接下来我把最近几天的学习思考以及总结的内容,和大家展开聊聊!
一、DeepSeeK“重塑”推理市场格局,用户更受益
DeepSeek-R1对标的是OpenAI o1,凭借其“免费、开源、可视化推理过程”,被Facebook首席人工智能科学家杨立昆誉为“开源模型对闭源模型的胜利”,今天看到朋友圈算力领域大佬的一句话“谁不适配DeepSeek,就会被人瞧不起,被质疑是不是干算力的”,我觉得非常有道理,目前各云服务商及算力平台服务公司纷纷适配DeepSeek,华为云属于最早的一批。
根据网上公开消息,华为云、腾讯云、百度智能云、阿里云、京东云、联通云、移动云等多家云厂商宣布上线DeepSeek大模型。青云科技、PPIO派欧云、云轴科技等独立云厂商也宣布适配及上架DeepSeek模型服务。此前,多家海外科技厂商陆续接入DeepSeek模型,包括亚马逊AWS、微软Azure、英伟达等。
从用户角度也都摩拳擦掌跃跃欲试,先不管真有多大作用,先本地化搞起来再说。下图是针对DeepSeek不同模型版本对显存和配置的需求参考。
二、整机厂商也纷纷推出模型一体机,热度先蹭起来
DeepSeek虽然让大模型在企业的本地化部署门槛降低了,但是本地化部署模型只是第一步,距离应用落地和价值发挥其实还有很长的路,如果把大模型比作一个“发动机”,单纯的发动机转速多快,马力多大如果和业务没有直接关联就没有什么意义,企业可以按需将发动机装在汽车里、也可以装在洗衣机里,同样道理,企业部署大模型后还必须配套知识库“数据”。原理图如下所示,大模型“发动机”其实可以随便换,真正关键的是企业私有的“高价值数据”。
目前国内一众厂商都纷纷出来蹭DeepSeek热度了,有的推出了大模型一体机,有的宣传了对DeepSeek不同模型版本的支持,从大模型一体机的角度,其核心优势和特点是帮助企业降低模型应用开发的门槛、提供推理性能优化、提升部署效率以及适配各类AI芯片等。当然很多大模型一体机厂商也会内置多种AI行业应用,比如金融(智能风控、合规审查)、党政(公文编写、舆情监控)、企业(知识库问答)等,核心思路是通过将复杂的AI工程化过程封装为标准化产品,让客户更便捷地调用大模型能力。
PS:我们超云的DeepSeek大模型一体机产品也会于近期发布(我的公众号会在第一时间与大家分享)。
三、国产AI芯片几乎同时官宣适配DeepSeek
我们知道在AI训练领域一直是NV的天下,推理芯片的门槛相对较低,国产AI芯片有很大的发挥空间,DeepSeek引爆了推理市场,前景广阔,源引“智东西”自媒体2月6日的报道,短短六天内,10家国产AI芯片企业(昇腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元碁、云天励飞、燧原科技、昆仑芯)相继宣布适配或上架DeepSeek模型服务。
四、AI大模型加速落地带来的算力需求增值
DeepSeek的开源,让更多企业和个人使用模型的成本降低,就好比更省油的车出现,并不是抑制了汽油的消费,而是更多的人开始买车了,反而汽油的消耗随之增加,符合Jevons矛盾(即:技术进步使某种资源的使用效率提高后,反而会导致资源的总消耗量增加,而不是减少),所以算力总需求是指数级的增长。
训练:随着自然数据的耗尽,基础大模型的训练算力将呈现对数发展,但是随着行业智能化的加速,使用行业数据对模型进行微调将进一步推动POST-training的算力增加。
推理:随着大模型走向端侧(PC,Phone,眼镜,车…),部署门槛的降低,推理算力将呈现指数发展。
PS:本段的上述文字和图片,源引“自华为云开发者联盟公众号文章”。
AI的未来是星辰大海,相信1~3年内,各式各样的大模型“服务”在ToC侧会发展成为像微信、抖音一样,会融入到每个人的工作和生活,在AI大模型的加持下,人与人的“能力和智力”差距会进一步缩小,在ToB侧会像现在的公有云、私有云模式一样,通过专用、量身定制的“智能体”提升企业自身运营效率。
以下是广告,算力之光商城,提供主流算力设备方案的供需拉通(可点击)!
下图的培训,老张是讲师之一,想了解的朋友可以扫描下图二维码咨询。