下一个重要事件:CES盛会

文摘   2024-12-30 18:02   北京  

点击↑红刊投服平台 关注我 设星标 不迷路


作者 | 边惠宗


这轮算力,从反馈字节开始,市场越来越认同:国产大模型在性能对比、生成速度、服务价格等方面,越来越具吸引力。字节AI将视觉理解模型价格带入“厘时代”,并且性能逼近GPT-4o;DeepSeek-V3在多项基准测试中比肩世界顶级模型,关键是它的API价格打到Claude 3.5 Sonnet的1/53,不管是技术降本还是极致性价比,这些吸引力无疑可降低外部开发者大模型使用成本,推动AI应用加快落地,模型推理次数提升,拉动推理算力需求快速增长。



当前市场对幻方的DeepSeek-V3训练所需算力的讨论较为热烈,市场担心训练算力需求缩减,因为这个参数量高达671B的大型语言模型的预训练过程仅用了266.4万H800 GPUHours,是Llama 3系列模型的1/15,性能强悍,他的低成本和低价格令人咋舌。这无非是在数据与算法层面进行了优化创新,具体的这让专家是进一步解释。


可以明确的是,训练次数是有限的,推理次数是无限的,在百模大战之后、训练数据有限的情况下,训练算力需求占比下行,推理算力快速提升是必然的。这一变化来自于AI应用从模型训练向应用推理的转变,大模型的军备竞赛进入推理阶段,当前推理算力的需求正在逐渐超过训练算力,未来推理算力的占比将上升到73%。


这波AI 算力炒的最透的算是铜缆连接,本来这块市场规模并不大,几十亿美元的空间,主要优势还是筹码结构好。这几天AI电力设备也炒了,包括配套的UPS、变压器甚至柴油发电机都挖了,可见这波炒的是比较透了。比如这波龙头博创、中恒【边学边做】,这几天强轧空,我觉得这些或许像以前的液冷,每当算力炒透这些配套就是阶段后期了。



AI推理需要应用到不同的端侧上,对于端侧AI而言,接下来一个重要催化就是1月7日-1月10日的25年CES国际消费电子展,展会将围绕人工智能、自动驾驶、智能家居、虚拟现实等话题,其中AI仍将是展会主旋律。AI/AR眼镜是比较热的,包括RayNeo雷鸟将和TCL一同带着尚未发布的新品-拍摄眼镜V3与光波导黑科技亮相;雷神科技将在展会上发布三款基于不同技术原理的智能眼镜产品。届时,端侧应该还会炒。


端侧AI这波焦点在SoC和ISP芯片上,如果近期能调整调整,应该还是有机会的。不止于此,AI推理更重视计算效率、时延、性价比等,所以端侧的存储、存算一体也是绕不开的。


《新质超级成长》
线上交流会
↓ ↓ 下图扫码了解详情 ↓ 


点击“在看”鼓励嘉宾分享更好的原创观点,感谢您的支持!


免责声明:本文内容仅代表作者个人观点,供交流学习,不作为操作建议,股市有风险,投资需谨慎,操作请风险自担!


更多投资者都在看:

骄阳 | 重视趋势性大题材

泛舟 | 历史上的1月

股海听萧 | 机构资金重掌“话语权”


知股汇小程序现已开通,读文章、看直播,快人一步!点此进入小程序!

(注:ios系统用户暂不支持小程序内购买)


点击在看涨停不断


红刊投服平台
组织证券市场周刊线上、线下交流活动;普及分享投资、权益知识、嘉宾观点。
 最新文章