外媒：零一万物逆袭OpenAI，技术仅落后五个月，成本降低97%！

科技 2024-10-22 17:45 陕西

编辑：阿冒

设计：沐由

在人工智能领域，中国公司正以惊人的速度追赶并超越西方同行。而在这个过程中，零一万物无疑是其中翘楚。由李开复亲自领导，零一万物通过一系列创新技术，成功地将 AI 模型的训练成本和推理成本都降低了97%，在成本优化方面远超 OpenAI、xAI、Google 等西方科技巨头。

本周，在由加州大学伯克利分校 SkyLab 和 LMSYS 的研究人员所发布的大模型排名中，零一万物凭借 Yi-Lightning 模型与发布了 Grok-2模型的xAI 一道并列世界第三的大模型公司，超越了 OpenAI 所发布的 GPT-4o（2024.05.13），这也是中国大模型首次实现“超越 GPT-4o”的里程碑式壮举。

更令人惊讶地是，零一万物的模型训练成本低到让马斯克都意想不到。xAI 为了进行 Grok-2 模型训练，花费了两万张 GPU，耗时4个月。而零一万物的 Yi-Lightning 仅用了 2000 张 GPU，训练了一个月，训练成本仅为 300 万美元，总成本仅为 Grok-2 的 2.5%左右。最后的结果呢？李开复打平了马斯克，并列第六。

在接受英国《金融时报》采访时，零一万物 CEO 李开复对外透露了零一万物的逆袭秘诀。面临尖端芯片获取的限制，零一万物通过使用较小数据集来训练 AI 模型、使用混合专家模型架构等方式，自创“模基共建”方法论，结合了硬件、芯片、内存、AI基础软件的垂直整合和优化，打造了Yi-Lightning（闪电模型）。该模型训练比xAI节省了97.5%，推理又比OpenAI GPT4o便宜31倍的。这样，零一万物既保证了模型性能处于世界第一梯队，又极大程度上降低了模型训练和推理成本。李开复补充说，零一万物的科研北极星不是“无论多贵多大，打造世界第一模型”，而是要打造一个世界第一梯队的模型、但是成本超低，能打造出高性价比模型，让开发者构建应用而不被推理成本压垮。

零一万物采用了“混合专家”模型架构，这是一种被美国研究人员率先提出但被中国公司发扬光大的模型架构。通过将多个基于特定行业数据训练的神经网络集合到一起，混合专家模型可以用较少的计算能力达到与稠密模型相同的智能水平。研究人员认为，混合专家模型架构是以较少的算力，达到与稠密模型相同智能水平的关键技术。但这种方法训练失败的可能性更大，比如说Meta的Llama就一直没有开发出来世界领先的混合专家模型，而中国公司似乎掌握了“混合专家”模型架构。尤其是零一万物和Deepseek，做出了世界最快的混合专家模型。

同时，零一万物在数据收集方面也做出了巨大努力。李开复对英国《金融时报》透露：“我们的数据收集方法远远优于传统的网络抓取方法，包括扫描书籍，爬取深网区数据，使用新颖的合成数据技术等。这种独特的数据收集方法，使得零一万物的模型具备了与竞争对手不同的特色和优势，就像孩子用了更优质的教材提升了教育水平一样。

这也是中国模型团队独有的优势所在，中国拥有大量技术优秀且价格合理的工程人才。李开复对英国《金融时报》表示：“工程师在数据标注和排序方面需要做很多不为人知的艰苦工作，但中国在这方面比美国更有优势。”这种人才红利，使得零一万物能够在更短的时间内实现技术的突破和应用的落地。

多方技术优势最终将 Yi-Lightning 的推理成本降到了极低水平。让我们来看一组惊人的数据：零一万物的 Yi-Lightning 模型，每百万个 token 的推理成本仅为 14 美分（0.99元人民币），而OpenAI 的更大模型 GPT-4o 的推理成本高达每百万个 token 4.4 美元。这是31倍的差距。李开复说：“中国的优势在于制造真正实惠的推理引擎，这是AI应用蓬勃发展最重要的一件事。”

“中国的优势一般不在在预算不封顶的情况下做出前所未有的突破性研究，而从移动互联网到AI1.0，我们都看到中国能做更好、更快、更可靠和更低成本地实现落地。我们现在面临应用即将爆发的前夕，对中国AI应用的未来，我非常乐观”，李开复说。

原文链接：https://www.ft.com/content/0a6da1bb-2bda-40f3-9645-97877eb0947c?shareType=nongift

http://mp.weixin.qq.com/s?__biz=MjM5MTY1MzkxOQ==&mid=2680260786&idx=1&sn=72965f9e161c33d0cd9fa58fad1bf318

胖头陀

不止于IT，希望能涉猎到更多领域和层面。

最新文章

从大禹治水到鹏凯“智”水，智慧的传承与升级

外媒：零一万物逆袭OpenAI，技术仅落后五个月，成本降低97%！

施耐德电气研修院4周年，8万同行都在用的学习平台有何来头？

AI重塑零售行业，技术带来无限可能

西门子：觅最佳的生态伙伴，筑最好的数字平台|商业创新同行者

数据保护服务，现代企业的必选项

老旧设备“重启人生”？施耐德电气变频循环机出场，换新易如反掌！

华为打造高质量充电基础设施，多措并举助力县域经济

重磅干货 | 施耐德电气 x 英伟达，推出首个智算中心参考设计

非正式会谈｜对话EcoXpert™伙伴合众慧能，廿载携手打造绿色图景

一步先步步先，用友YonSuite加速企业高增长的秘诀是什么？

望龙电脑的一小步，信创产业的一大步？

在飞驶的汽车里，如何让肉体与灵魂不再错位？

配电设备不省心？放心交给“全”能施管家

携云上象山，甬为天下先

你的“储蓄” 意识，该升级换代了！

解难题做难事，华为云全栈AI创新重塑千行万业

践行国产化替代，优刻得私有云勇当先锋

生成式AI新篇章：亚马逊云科技助力重塑数字未来

中国西部AI创新港，数字经济的新引擎

奇迹！红海之滨的绿色新城

亚马逊云科技，引领生成式AI的新时代

生成式AI，在云端的绽放与盛开

性能30%↑｜阿里云AnalyticDB*AMD EPYC，数据分析步入Next Level

直播预告 | 一小时更换断路器？施耐德电气携手法腾电力开启“焕新大挑战”

Aruba：无处不在的保护，无所不及的智能

U9 cloud助力中国制造扬帆出海，冲浪全球

新华三：以”四桨协同“之道，领数智化风潮

以华为云为底座，妍丽高走美妆零售数智化之路

重写《红楼梦》？你不是在骗我吧！

零一万物API开放平台开箱，更多企业解锁AI 2.0潜能

异构智算国产创新｜联想首台搭载国产AI算力芯片服务器成功交付

首创技术：维谛Vertiv作为英伟达NVIDIA独家制冷合作伙伴，引领AI应用快速发展

强强联合，携绿同行｜施耐德电气与水木明拓签署合作协议

协同创新，共赴云端：今日人才在华为云上的故事

加推科技，华为云上生长的营销革新

娅奴服饰：行至云深处，问计新零售

谁在描摹千万政企的数字版图？

教育+VR：华为云上绽放的无限可能

这是我见过最强的AI大模型教程！可以上车！！

看得见的未来：华为发布2024数据中心能源十大趋势

云端绘影，让青玉案跃然眼前

各位，请入局AI大模型，现在！立刻！马上！！

技术变革即将爆发，谁来释放企业级生成式AI的潜力？

华为云创新中心，引领浙南的数字化腾飞

智算引擎再启动，联想开启数字时代新纪元

数智化引领革新，环思智慧联手用友驱动纺织行业升级转型

施耐德电气联手固特安能捷，筑建傅雷图书馆零碳未来

（待会删）yyds，付费搞来的AI资源，请低调使用！

云端赋能大湾区：华为云照亮数字化转型之路

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉