首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

大模型“以厘计价”，谁能扛住价格战？

科技 2024-05-24 11:06 北京

最近一周，铺天盖地都是大模型降价的消息。

字节降完，智谱降；阿里降完，百度降；腾讯降完，科大讯飞降......是不是很像蹲萝卜的游戏？

事实上，国内有头有脸的大厂几乎都加入了这场游戏。接二连三地降价，让人一瞬间有了当年共享单车和云计算价格战的感觉。

互联网时代，所有人都习惯于大规模烧钱来获得最后的胜利。但AI时代，这套玩法还行得通吗？

国产大模型“以厘计价”

降价在商业世界里并不难理解，无非是“降价促销”、“以价换量”。

大模型领域的扛把子OpenAI就已经多次降价。

从去年3月OpenAI发布GPT4到现在，其产品从GPT4升级到GPT-4o，输入价格从0.03美元/千tokens下降到0.005美元/千tokens，降幅为83%；输出价格从0.06美元/千tokens下降到0.015美元/千tokens，降幅为75%。

但惊人的是，国内大模型比OpenAI更狠，直接把价格“打骨折”。

5月11日，智谱AI大模型的个人版GLM-3Turbo模型产品的调用价格从0.005元/千tokens降低至0.001元/千tokens，直降80%；GLM-3 Turbo Batch 批处理API也便宜了50%，价格仅为0.0005元/千tokens。

紧接着，5月15日，字节宣布豆包通用模型pro-32k版、pro-128k版在企业市场的推理输入价格仅为0.0008元/千tokens、0.005元/千tokens，较行业降幅达99.3%、95.8%，并声称已经击穿了大模型行业的最底价。

但“价格屠夫”还在后面。5月21日，阿里云通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0.0005元/千tokens，直降97%。

各大厂动不动就降价90%以上，已经是硝烟四起，然而还有更狠的角色——百度直接宣布文心Speed和文心Lite两款模型免费，开启了大模型API调用的“免费时代”。

5月22日，腾讯也按耐不住了，宣布主力模型之一的混元-lite 模型不仅从4k升级到256k，而且全面免费。

同日，科大讯飞首推永久免费大模型，讯飞星火API能力向全球用户开放。

有网友戏称，大模型正从“以分计价”的定价模式向“以厘计价”的时代迈进。

价格战提前来临？

其实大模型降价并不稀奇，但稀奇的是商业化还没跑通，怎么价格战就先来了？

根据此前预期，大模型大致将按照每年50%-75%幅度降本，但现在大模型的降本速度远超预期。

答案很简单：加快商业化落地。

随着大模型参数越来越大，研发成本也越来越高。在巨大的成本压力下，大模型厂商不得不加紧寻找一条商业化之路。

根据无问芯穹发起人汪玉，用公开数据做了一次针对算力成本数量级的测算，假设GPT-4 Turbo每天要为10亿活跃用户提供服务，每年的算力成本可能超过两千亿，这还不包括模型训练的投入。

华为大模型负责人田奇曾提到，大模型开发和训练一次需要约1200万美元，这表明即使技术再领先的公司，大模型的训练也是非常昂贵的。

百川智能创始人CEO王小川也曾表示，每1亿参数对应训练成本在1.5到3万人民币之间。因此，一个千亿级参数的模型单次训练成本预估在3000万至5000万人民币之间。

显然，高昂的研发价格，已经成了AI商业化的枷锁。绝大部分公司的收入仍然还在亿的级别。以这种成本去打造商业闭环，显然是不成立的，而降价就成了最直接且最快速的落地方式。

同时，价格战能掀起的另一个因素是，大模型技术已经卷得差不多了。

外卖、快递、网约车、社区团购乃至新能源车等价格战火热的行业，或多或少都是由于同质化竞争而导致的，大模型也可能是当前卷性能带来的收益越来越低。

在《LLMs正达到收益递减的证据——及其可能意味着什么》一文中，作者认为大模型在性能提升方面可能已达到收益递减的临界点。以OpenAI为例，从GPT-2到GPT-3、GPT-3到GPT-4都有巨大的飞跃，但GPT-4到GPT-4 Turbo就没有那么多了。

如果大模型的性能发展真的要迎来一面墙，那么对于大模型公司来说，如何抢下用户是现阶段最重要的一步。

目前，国内大模型先头部队大多已接近GPT-4的能力，而这一能力已具备商业化的基础。经过一年多的技术比拼，大模型显然已经到了大规模市场验证的阶段。

因此，2024年大模型开始了从“卷技术”向“卷应用”的转变，商业化、落地应用成为大模型公司的主旋律，而降价将为大模型的应用落地带来了极大推动力。

谁能扛住价格战？

虽然大家都在价格上卷起来了，但并不是所有企业都能加入价格战。

降价涉及到大模型的研发、训练、推理等一系列成本的优化，只有把大模型的研发成本尽可能的降低到最小，才有降价的空间和资本。

毋庸置疑，大厂是最扛打的一波。

在这轮价格战里，云厂商是最重要的发起方之一，先有字节的火山引擎，后来百度智能云、阿里云、腾讯云先后加入。

对云计算公司来说，大模型商业化能不能跑通，并不重要。更重要的是，如何依托于大模型新需求，打破过去云厂商的格局，重新建立自己的领先位置。

根据媒体报道，阿里云内部已经提出一个非常激进的目标，在三年之内，要占领国内大模型云计算市场的90%。这也是为什么阿里把国内5家大模型独角兽都投了一遍。

而火山引擎自2020年才对外提供服务开始，一直想以传统云计算模式去追赶大厂，始终没有太大起色。大模型出现改变了这一切。去年以来，它开始将字节跳动的AI能力作为突破口，试图打破旧有格局。这次降价也是这一逻辑下发生的。

事实上，基于大模型卖云服务并不是大厂唯一的商业模式。基于大模型重构应用，乃至打造大模型时代的超级应用，成为大厂在AI时代的新目标。

如果能够像互联网和移动互联网时代一样，诞生淘宝、微信这样的超级应用，大厂们又将迎来商业史上新的辉煌。

目前，百度已经完成了对百度文库、百度搜索、百度地图、如流等业务的AI重构。

阿里对钉钉、高德地图、闲鱼、饿了么、优酷、盒马、淘票票，天猫、淘宝等阿里集团最核心的产品进行了全面升级。

字节内部也开启了赛马机制，抖音、剪映等50多个业务线各自为营开始了AI探索。过去一年里，除了主打的豆包App外，基于豆包大模型，还推出了互动娱乐应用“猫箱”，以及星绘、即梦等AI创作工具。

腾讯则将混元大模型落地在超600个腾讯内部业务和场景中，包括企业微信、腾讯会议、腾讯文档等“一门三杰”产品，也包括腾讯乐享、腾讯电子签、腾讯问卷、腾讯云AI代码助手等协作SaaS产品。

相比大厂的高举高打，大模型创业公司就显得不那么从容了。

百川智能创始人王小川表示，百川并不会“掺和”到价格战当中，原因在于，当前To B并不是百川的主要商业模式，价格战对其影响有限，百川更多的精力，还是会放在超级应用当中。

零一万物的李开复博士认为，目前零一万物带给的性能、性价比都很高了，不打算降低YI系列模型的API价格。“就像特斯拉，他不会因为别的牌子车比他卖得很便宜，他也要来降价。”

率先掀起价格战，喊着“不做应用做研究”的DeepSeek，也没有在各家大厂密集召开降价发布会时发声，显得无心参战。

无论创业系公司如何自圆其说，和财大气粗的大厂相比，一不小心都有可能震荡出局。

更大的挑战在于，国内大厂和大模型厂商基本都走模型+应用路线，推出各自的To C App，不少AI助手也已经开始大规模的市场投放。

不管是基础大模型的价格战，还是To C应用的用户争夺战，战火都已经烧起来了。

结语

无论从哪个角度看，把大模型拉入价格竞争，都不是一个明智的做法，也不一定会让大模型厂商迎来商业闭环。但现实是，这事就这样发生了。

既然大模型未来的发展谁都看不清，那就先降价把用户拿下来再说。这是移动互联网过去10年被证明过无数次的真理。

拿到用户，不管商业化能不能跑通，至少融资、并购后面还有的聊。但没有用户，你连上谈判桌的资管都没有。

在这种情况下，大模型厂商降低开发者成本，让更多开发者参与进来，帮助他们去触碰曾经触碰不到的用户，显然就是一条必经之路。

相关阅读

何许人也？敢把大模型价格“打骨折”？

别拿「豆包」不当干粮，新晋AI顶流好猛！

走入商业化拐点，大模型“开箱即用”或突破行业困局

大模型加持后，数字人“更像人”了吗？

卷完参数卷应用，大模型落地有眉目了？

【科技云报道原创】

转载请注明“科技云报道”并附本文链接

http://mp.weixin.qq.com/s?__biz=MzUyNDE4NDE1Mg==&mid=2247501680&idx=1&sn=d90bfa18b1811b14840c2f88747902d9

科技云报到

云计算、网络安全、人工智能、大数据、区块链领域垂直新媒体，专注原创的企业级IT内容行家

最新文章

TA能“跑赢大盘”，靠的竟是这三点！

数字化转型，从不确定性到确定性的关键路径

云数据库“再进化”，OB Cloud如何打造云时代的数据底座？

大模型时代下，向量数据库的野望

云服务的中场战事，从AI应用开始

如何让智能客服像真人一样对话？容联七陌揭秘：多Agent大模型

从“可用”到“好用”，百度智能云如何做大模型的“超级工厂”？

以数据“价值三角”为擎，探索数据治理实践路径

有“韧性”才能更“任性”，云韧性构筑业务最后一道防线

从“N 号房”看Deepfake乱象，如何证明“我”不是我？

天地一体，电信安全织牢智能时代“安全网”

从云计算到AI大模型，云巨头生态革命迈出关键一步

大模型的“掘金卖铲”生意，AI Infra的最佳机会来了？

“大模型+机器人”，具身智能将开启“智械时代”

大模型引领技术浪潮，AI安全治理面临“大考”

算网筑基AI注智，中国联通如何讲出AI时代的“新故事”？

将技术普惠进行到底，百度智能云云原生数据库GaiaDB来啦！

产业为根大模型应用为擎，容联云推动企业营销服场景重塑

人工智能“顶流”齐聚WAIC 2024，他们都做了什么？

XDR+GPT，高校安全运营建设的最优解

推进工业新质生产力，机器人有望成为AI下一个“新引擎”？

“元年”之后，生成式AI将走向何方？

客服中心如何营销服一体化？容犀Desk上大分！

从“实验室”到“生产线”，2024年GenAI迎来行业应用拐点

大模型风起云涌，向量数据库终有“用武之地”？

AGI渐行渐近，该加速还是要踩刹车？

大模型“以厘计价”，谁能扛住价格战？

大模型落地，如何跨过数据这道坎？

何许人也？敢把大模型价格“打骨折”？

国产桌面操作系统能“平替”Windows吗？

59.5%增速拔得头筹，超云服务器逆势飞扬的秘诀

大模型加持，艺赛旗“智能超自动化平台”成色几何？

别拿「豆包」不当干粮，新晋AI顶流好猛！

从亚运到奥运，大型国际赛事共赴“云端”

走入商业化拐点，大模型“开箱即用”或突破行业困局

AIGC掀算力需求革命，边缘计算将不再“边缘”

“老三样”不管用了，网络安全要靠啥？

AI大模型疯长，存储扛住了吗？

大模型加持后，数字人“更像人”了吗？

从“奇点”到“大爆炸”，生成式AI开启“十年周期”

卷完参数卷应用，大模型落地有眉目了？

“淘金”东南亚和“一带一路”，中国数字技术加速出海

从“算力核弹”到生成式AI，新纪元还有多远？

重构销售话术和知识库，容联云找到了大模型的“钉子”

造完“大模型”，“具身智能”将引领AI下一个浪潮？

第五次工业革命，中国AI企业如何打造新质生产力？

“苟”了多年的国产操作系统，开始“逆袭”？

两会热议的数据要素，如何拥抱新技术？

大模型产业落地，安全运营能否迎来“自动驾驶”时刻？

阿里云降价，京东云跟进，谁能打赢云计算价格战？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉