深度丨成本领先或是中国大模型的唯一机会，零一万物、字节们的推理成本已领先OpenAI，仅为GPT-4o的4%

文摘 2024-10-21 09:00 上海

与以OpenAI为代表的美国大模型公司相比，中国大模型公司肃然面临着尖端芯片获取、资金投入等方面的挑战，但是他们正在通过降低成本来打造具有国际竞争力的模型。

红杉资本的报告曾指出，AI产业每年需实现超过6000亿美元的产值，才能支付数据中心、加速GPU卡等AI基础设施的费用。根据《AI指数》的估算，最新一代人工智能模型的训练成本已经达到前所未有的水平。比如，OpenAI的GPT-4预计使用了价值7800万美元的计算资源进行训练，谷歌的Gemini Ultra则耗费了1.91亿美元的计算资源成本。

Anthropic创始人 Dario Amodei 在接受采访时表示，模型的每次迭代都需要使用更多计算资源，核心基础模型工程正变得越来越昂贵。目前训练一个模型的成本大约为 1 亿美元，上下浮动两到三倍。Anthropic现在正在训练的模型成本将接近 10 亿美元。在 2025 年和 2026 年，他预计模型训练成本将更加接近 50 亿或 100 亿美元，与马斯克所预测的GPT 5的成本类似。

高昂的训练费用只有少数的科技巨头和AI龙头可以负担，传统的科研机构，比如大学、人工智能研究中心已经被排除在外，无力开发自己的基础模型。

与此同时，新的观点普遍认为，基础模型训练的资本支出或是“历史上贬值最快的资产”。尤其是以OpenAI为代表的大模型公司在训练和推理方面的支出已超过其收入。上个月，OpenAI刚在史上最大的一轮风险投资中筹集了66亿美元和其他数十亿美元的银行资金池，以覆盖预计到2026年将产生的高达140亿美元的亏损。

中国的AI公司正独辟蹊径。在头部的初创企业中，如零一万物（01.ai）和DeepSeek选择使用优质但较小数据集来训练AI模型，将大模型成本越推越低。字节跳动、阿里巴巴等大厂也燃起了大模型价格战，将调用大语言模型生成回答这段技术所需的“推理”成本降低了 90% 以上，仅为美国同行的价格的极小一部分。

零一万物创始人李开复表示，零一万物在较小的数据集上训练出了对算力要求较低的模型，并且创造了模基共建的方法，结合了硬件、芯片、内存、AI基础软件的垂直整合和优化，打造了Yi-Lightning（闪电模型）。该模型的推理成本比OpenAI GPT4o便宜31倍。

本周，在由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员所发布的大模型排名中，零一万物凭借 Yi-Lightning 模型与发布Grok-2、与马斯克创办的xAI并列为全球排名第三的大模型公司，仅次于 OpenAI 和谷歌的最新模型。

LMSYS是基于用户提出真实问题，然后针对不同模型的回答给出盲测投票，最终汇总成为对各个模型的评分。OpenAI、谷歌都在这里发布所有的模型，并接受LMSYS的排名。包括字节跳动、阿里巴巴和 DeepSeek 等其他中国大模型玩家，也悄悄爬上了 LMSYS 排名榜。

根据《金融时报》的报道，李开复认为，中国的优势在于制造真正实惠的推理引擎，这是AI应用蓬勃发展最重要的一件事。

零一万物 Yi-Lightning 的推理成本是每百万个 token 收取 14 美分（0.99 元人民币），而 OpenAI 的较小模型 o1-mini 每百万个 token 则需要 26 美分。与此同时，OpenAI 的更大尺寸的模型 GPT-4o 的推理成本为每百万个 token 4.40美元。AI 大模型生成回答所用的 token 数量取决于查询的复杂度。

李开复还表示，Yi-Lightning 模型的“预训练”成本为 300 万美元，这指的是模型关键训练阶段的成本，之后可以根据不同的应用场景进行微调或定制。这预训练成本仅为 OpenAI 训练GPT-4的3%，而且Yi-Lightning性能还超越了GPT-4。他补充说，零一万物的科研北极星不是“无论多贵多大，打造世界第一模型”，而是要打造一个世界第一梯队的模型、但是成本超低、高性价比的模型，让开发者构建应用而不被推理成本压垮。

根据媒体报道，包括零一万物、DeepSeek、MiniMax 和阶跃星辰在内的许多中国大模型公司，都采用了所谓的“混合专家”模型架构。与 “从互联网和其他来源抓取数据构建起庞大数据库上，并一次性地训练一个庞大的‘稠密模型’”不同，“混合专家”模型选择将多个对不同领域可称为“专家”的神经网络集合到一起。

研究人员认为，混合专家模型架构是以较少的算力，达到与稠密模型相同智能水平的关键技术。但这种方法训练失败的可能性更大，因为在模型训练过程中需要同时协调多个“专家”模型，而非集中关注单个模型的训练。因此不少美国公司（如Meta的Llama）就没有开发出来，而中国公司似乎掌握了“混合专家”模型架构。尤其是零一万物和Deepseek，做出了世界最快的混合专家模型。

鉴于获取尖端AI 芯片供给的禁令和难度，中国 AI 领域的玩家在过去一年中一直在竞相开发高质量数据集来训练这些“专家”，使得自家模型具备与竞争对手不同的特色。零一万物采用了远远优于传统网络抓取方法的数据收集方法，包括扫描书籍，爬取深网区的数据，使用新颖的合成数据技术等。

李开复认为，中国拥有大量技术厉害且刻苦耐劳的工程人才，在这方面比美国更有优势。在有预算约束的情况下，中国的优势不一定是要做出前所未有的突破性研究，而是以更好、更快、更可靠和更低成本地实现技术的落地。

来源：

[1] Chinese AI groups get creative to drive down cost of models, https://www.ft.com/content/0a6da1bb-2bda-40f3-9645-97877eb0947c

欢迎扫码加群参与讨论

---------END--------

我们相信认知能够跨越阶层，

致力于为年轻人提供高质量的科技和财经内容。

投稿邮箱：zfinance2023@126.com

稿件经采用可获邀进入Z Finance内部社群，优秀者将成为签约作者，00后更有机会成为Z Finance的早期共创成员。

🚀 我们正在招募新一期的Z Explorer

Z Finance

我们相信认知能够跨越阶层，致力于为年轻人提供高质量的科技和财经内容。

最新文章

速递｜美对字节态度风向转变，参议员正敦促拜登政府延长TikTok出售期限90天

速递｜CEO亲自上庭后高通胜诉ARM，但芯片设计许可纠纷尚未平息，ARM或将上诉

速递｜谷歌或取消在安卓新设备上预装浏览器，认为法院强拆Chrome将抑制创新

Z Waves｜朱啸虎：传奇独角兽捕手，投中滴滴饿了么，套现ofo，错过字节，炮轰kimi

深度｜微软投资数百亿成英伟达芯片全球最大买家，字节与腾讯位列第二第三

速递｜美国对华反垄断监管升级，腾讯放弃Epic Games董事会席位

ZPedia丨可灵AI：从隔空拥抱到赛博试衣间，国产AI的花活已经甩开Sora一条街

速递｜重磅！美国最高法院同意听取TikTok上诉辩论，或将审查TikTok禁令是否违宪

速递｜张一鸣在香港成立资产管理公司，或将专注风险投资

深度｜亚马逊云科技re:Invent 2024，全新Nova系列大模型与AI芯片赋能企业AI落地，让选择成为核心竞争力

速递｜MiniMax旗下Talkie疑美服下架，年收入7000万美元，已是AI独角兽旗下最成功的出海产品

速递｜小红书高管再次调整，今日资本原合伙人担任战略负责人，将组建战略投资团队

速递｜通义从阿里云分拆，ToC团队并入夸克，ToB团队迁移至智能信息事业群

速递｜智谱完成新一轮30亿元融资，新战投和国资加入，商业化实现翻倍，MaaS平台日均Tokens消耗量增长150倍

速递｜TikTok请求美国最高法院阻止政府禁令，特朗普表示对TikTok有感情

速递｜Google DeepMind发布新视频模型，可以生成2分钟以上视频，分辨率最高可达4k

速递｜月之暗面最终豁免日，但朱啸虎并不打算原谅张予彤，1亿美元免费原始股需要补偿老股东

速递｜TikTok Shop一年时间超越Shein和Sephora，已成为美国消费者线上购物首选

速递｜监管部门批准64项AI服务，行业竞争加剧，市场或趋于饱和

深度｜高瓴转向，新基金计划募资80亿美元布局日本等亚洲市场，募资也将聚焦亚洲和中东国家

速递丨美国法院驳回字节暂缓TikTok禁令的请求，国会要求谷歌和苹果准备从应用商店移除TikTok

速递丨谷歌发布Android XR操作系统，在XR设备竞争上谷歌通过Gemini构建XR生态系统

速递丨小红书2024年利润预计突破10亿美元，相比2023年翻倍

速递丨前暴雪CEO仍然有意收购TikTok，将在川普上台后推进

速递丨微软推出基于合成数据集的新一代Phi-4，小模型也可以擅长数学推理

速递丨小红书日搜索量1年翻倍已接近百度一半，百度失去搜索龙头地位或只是时间问题

速递丨监管机构已要求拼多多调整“仅退款”政策，称为小型商家带来了不公平的负担

速递丨TikTok起诉加拿大政府，要求撤销关停加拿大子公司的命令

ZPedia丨2024年11月AI产品榜单，Kimi登顶国内总榜，豆包狂追不止，Kling AI连续2月大跌

速递｜面壁智能完成新一轮数亿元融资，将在端侧AI领域加速商业化布局

速递｜小红书重组业务部门成立应用算法部，商业化进一步提速

速递｜英伟达反垄断调查或是”警告“，但仍可能面临销售额10%近10亿美元罚款

速递｜亚马逊押注agent成立新实验室Amazon AGI，Adept华人联创David Luan领导！

深度｜张一鸣正亲自下场招募AI大牛，字节布局海外算力已成为英伟达在亚洲最大客户之一

速递｜TikTok请求暂停拆分禁令待最高法院审查，拜登政府希望法院迅速驳回

速递｜腾讯或搁置收购《刺客信条》开发商育碧，与吉勒莫家族因控制权争议陷入僵局

速递｜英伟达涉嫌垄断被立案调查，此前收购迈络思案的限制性条件到底是什么？

速递｜前百川智能联合创始人洪涛离职，或因AI商业化不达预期

速递｜字节、阿里和腾讯将在AI顶会NeurIPS上演抢人大戏，这一届AI博士应届年薪165万

速递｜德勤起诉中国区前副主席等3位合伙人，称下载大量机密文件用于加入竞争对手

速递｜TikTok网红担心禁令将使粉丝一夜清零，正向Ins和YouTube倒流

速递｜最高法院可能不会受理，字节希望暂停禁令时间与特朗普政府达成协议，否则1个月后将被迫关停美国业务并裁员

深度｜DeepMind CEO对谈诺奖得主：AI无法替代人类科学家，科学最难的是提出正确的问题

速递｜TikTok败诉，华盛顿特区上诉法院裁定拆分法案有效，字节需要在1月19日之前出售TikTok

速递｜朱啸虎隔空喊话杨植麟：回避了所有问题，要堂堂正正的做人做事

速递｜杨植麟回应朱啸虎，但很多问题我们还是一头雾水

ZPedia｜夸克搜索：90后都在用的阿里“秘密武器”，其实是AI全能助手的AI搜索

速递｜砺思资本对冲基金今年已实现53%回报率，明年1月将推出2亿新基金

速递｜马斯克的xAI又融了60亿美元，估值已超400亿美元

速递｜朱啸虎表示金沙江创投愿意豁免月之暗面及创始人，但会继续追责张予彤

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉