点击↑红刊投服平台 关注我 设星标 不迷路
这轮算力,从反馈字节开始,市场越来越认同:国产大模型在性能对比、生成速度、服务价格等方面,越来越具吸引力。字节AI将视觉理解模型价格带入“厘时代”,并且性能逼近GPT-4o;DeepSeek-V3在多项基准测试中比肩世界顶级模型,关键是它的API价格打到Claude 3.5 Sonnet的1/53,不管是技术降本还是极致性价比,这些吸引力无疑可降低外部开发者大模型使用成本,推动AI应用加快落地,模型推理次数提升,拉动推理算力需求快速增长。
当前市场对幻方的DeepSeek-V3训练所需算力的讨论较为热烈,市场担心训练算力需求缩减,因为这个参数量高达671B的大型语言模型的预训练过程仅用了266.4万H800 GPUHours,是Llama 3系列模型的1/15,性能强悍,他的低成本和低价格令人咋舌。这无非是在数据与算法层面进行了优化创新,具体的这让专家是进一步解释。
可以明确的是,训练次数是有限的,推理次数是无限的,在百模大战之后、训练数据有限的情况下,训练算力需求占比下行,推理算力快速提升是必然的。这一变化来自于AI应用从模型训练向应用推理的转变,大模型的军备竞赛进入推理阶段,当前推理算力的需求正在逐渐超过训练算力,未来推理算力的占比将上升到73%。
这波AI 算力炒的最透的算是铜缆连接,本来这块市场规模并不大,几十亿美元的空间,主要优势还是筹码结构好。这几天AI电力设备也炒了,包括配套的UPS、变压器甚至柴油发电机都挖了,可见这波炒的是比较透了。比如这波龙头博创、中恒【边学边做】,这几天强轧空,我觉得这些或许像以前的液冷,每当算力炒透这些配套就是阶段后期了。
AI推理需要应用到不同的端侧上,对于端侧AI而言,接下来一个重要催化就是1月7日-1月10日的25年CES国际消费电子展,展会将围绕人工智能、自动驾驶、智能家居、虚拟现实等话题,其中AI仍将是展会主旋律。AI/AR眼镜是比较热的,包括RayNeo雷鸟将和TCL一同带着尚未发布的新品-拍摄眼镜V3与光波导黑科技亮相;雷神科技将在展会上发布三款基于不同技术原理的智能眼镜产品。届时,端侧应该还会炒。
端侧AI这波焦点在SoC和ISP芯片上,如果近期能调整调整,应该还是有机会的。不止于此,AI推理更重视计算效率、时延、性价比等,所以端侧的存储、存算一体也是绕不开的。
免责声明:本文内容仅代表作者个人观点,供交流学习,不作为操作建议,股市有风险,投资需谨慎,操作请风险自担!
更多投资者都在看:
知股汇小程序现已开通,读文章、看直播,快人一步!点此进入小程序!
(注:ios系统用户暂不支持小程序内购买)
点击在看,涨停不断