大模型测试中的问题:在OpenAI发布相关产品后的测试中,发现服务出现断断续续中断现象,提示词交叉,生成视频出现bug,且bug数量不少。
大模型发展需求:随着大模型在最近一年受益于基础设施带来的模型侧能力提升,算力需求增加。国内外在多个领域存在竞争,理想的底座模型参数在短期内至少应达到5万亿以上,目前离这一指标远远不够。
应用侧的预测:通过产品的日活月活用户数量、付费百分比、相关应用的token量等指标,根据过去曲线预测未来收入增长情况。若出现爆款应用,明年收入有翻倍的可能性,因此800亿美金的投资并不显得过高。
地区分布:除美国外,欧洲肯定会有一部分投资,亚洲的韩国、香港等地也可能会有投资。此外,电力部分也会有投入,微软看好AI核聚变,会在电力层面做前期资金进入。
具体开支方面:超过6成左右用于芯片及相关服务器、内存、交换机机架等硬件;一小部分用于高性能计算所需的全套软件;10%以上用于机房建设等固定领域;还有一部分用于与企业的资金合作等方面。
用户数据安全和隐私:通过技术层面,在模型层面训练出安全模型,让模型能够学习判断输入输出的安全性,进行相应的舍弃。但法律层面的规定目前还存在困难,且行业内存在一些抗议,但中国业界从业者及企业对AI的接受度较高。
能源消耗与环境压力:虽然AI技术的发展可能导致能源消耗增加和环境压力上升,但芯片厂商推出的卡能效比以前强很多,从设备需求角度讲,降低了对环境的影响。
硬件成本与行业竞争:AI普惠是趋势,AI推理成本从22年底到现在下降了近20%,到2025年底,百万token的消费价格可能会降到很低,这将缓解硬件成本过高对行业的影响。
训练阶段未达预期:国内模型参数量有待提升,通用模型的通用能力非常重要,OpenAI预计到2025年年底或2026年上半年,模型参数量会比现在增长两三倍左右,达到短期的5万亿参数左右的点。
训练和推理算力展望:训练侧还有很多路要走,目前训练测算力还是较高,但25年需要关注AI与AGI的结合以及AI与终端侧的结合,这两个点若在上半年得到较好发展,推理侧的需求可能会大幅增加,但具体比例难以确定。
国内算力情况:国内算力侧积极发展,如字节跳动积极购买NVIDIA卡并对接国产卡,智谱为华为卡出评测,发现国产卡在一定程度上可作为A100或A800的平替,中等及中等偏上客户受益于华为国产生态体系的卡,像海光信息等也有较好表现。
腾讯模型:腾讯大模型起步较晚,开源可能会走向闭源。早期大模型组缺乏凝聚力,模型参数较小,在国内各大企业推出几千亿参数后,腾讯还在研究较小参数的模型。但腾讯开源版本效果在开源中算不错,可借助开源收集问题和数据提升能力,有望慢慢走到第一梯队。
国产卡的使用情况:大厂使用国产卡的比例目前整体偏低,但增长速度较快。对于一些中等及以上客户,国产卡如华为910B在一定程度上可平替A800、A100,但对于中小企业和个人开发者,对其吐槽较多。其他大厂也会逐渐增加与国产卡的适配。央国企使用英伟达卡受到严格限制,大厂在渠道较多且资金充足的情况下,获取卡相对容易,但如果被认为涉及军事相关可能会受影响。
加微信领取星球优惠