见证历史！国产大模型首次在公开榜单上超过GPT-4o

科技 2024-10-17 19:35 北京

前不久，“大模型六小强”之一的零一万物还在被传放弃了预训练大模型，结果昨天直接就丢下了一个重磅“炸弹”。

10月16日上午，零一万物在线上举办的新品发布会上，正式发布自家全新旗舰大模型“Yi-Lightning”。Lighting直译为闪电，意思应该是新模型的推理速度进一步提升。

在国际权威盲测榜单 LMSYS 上，Yi-Lightning 干掉了 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet，排名世界第六，中国第一。

第一，LMSYS确实是国际权威盲测榜单，不是野鸡排行榜。

之前很多人嘲讽国产大模型就会刷榜，做一些开卷考试题，但是这次零一万物参与的这个榜单确实具有权威性。

LMSYS Org作为一个公开性质的研究团体，源自学术界的强强联合，由加州大学伯克利分校、加州大学圣地亚哥分校以及卡耐基梅隆大学的学生与教职员工共同组建。LMSYS Org 推出的Chatbot Arena凭借其创新的“实战竞技”模式与测试团队的严格标准，迅速赢得了全球行业的广泛认可。

而且，这个盲测结果来自全球累积超千万次的人类用户投票。

就连OpenAI在正式揭晓GPT-4o之前，也是选择在LMSYS平台上进行了匿名预测试，足见对其信任与依赖。

前段时间大模型竞技场还更新了规则，新榜单对AI回答的长度和风格等特征做了降权处理，这样大模型就不能光靠格式和长度来增加分数了，得分更加看重模型真正解决问题的能力。

第二，只有模型能力和成本问题能够被逐步解决，基于AI的商业生态才能真正健康地发展。

李开复强调，“要激活一个健康的生态系统，关键在于拥有顶级的模型，并且这些模型的价格要足够低，以促进应用的发展。如果模型太贵，可能会导致应用开发公司破产。”

“关键在于，如果好的模型价格过高，应用就无法迅速普及，也就无法实现普惠。我们今天发布的模型，希望能够让我们更接近这一愿景。”

零一万物最新模型的价格是0.99元人民币/百万 token，有人认为零一万物这是参与了价格战，但是李开复不这么认为。

李开复解释道，0.99/百万 token 的价格看似卷起来了，但实际应用中，调用量累积下来还是很大，因此需要把价格平衡在一个适当的区间，「不会赔钱卖模型，但也不会赚很多钱，而是在成本线上加一点点小小的利润」，以保证开发者能在用上优秀模型的前提下，再去挑最便宜的。

第三，李开复帮六小龙辟了谣：预训练的钱，头部公司都付得起。

李开复说：据我所知，这六家公司融资额度都是够的，我们做预训练的production run，训练一次三四百万美金，这个钱也是头部公司都付得起，我觉得中国的六家大模型公司只要有够好的人才，想做预训练的决心，融资额跟芯片都不会是问题的。

最后，李开复博士之前曾表示不会从事亏损的To B业务，但是这次发布会零一万物还发布了面向ToB市场的首款产品——AI 2.0数字人，为零售和电商场景设计，也就是说在探索To B市场。

对此，李开复的说法是：我们觉得这样的to B工作只能在中国做，因为要触达美国的用户或国外的用户不太可能，所以全世界的范畴来说，to B供应商基本都是当地的，即便在中国要买SAP的产品也是SAP中国卖给你，所以跨国的设立分公司做to B绝对不是我们或其他的创业公司能做的，所以to B的国外就放弃了，做to B就做国内，做to B就做有利润的解决方案，而不只是卖模型，不只是做项目制，这是我们to B的做法。

现在看，李开复博士对于做AI充满了信心，甚至对整个AI六小龙都充满信心，这是好事儿。毕竟国产大模型要想跑出一个第一名来，不是六小龙，就是大厂。

只有国产大模型做好了，我们这些用户才能用到好的产品。

盼人好，是一种美德。

http://mp.weixin.qq.com/s?__biz=Mzg5Njc3MDAwMQ==&mid=2247484416&idx=1&sn=9fe42eae02dffc98c78a24b9e74b12ab

数字进化岛

洞察科技产业，透视全球真相。

最新文章

百度Q3净利润增长17%超预期，为啥美股港股双双下跌？

强烈建议麦琳和李行亮锁死，谁也别出来祸害别人

胖东来和钟睒睒，请你们大胆说下去

AI让人类去死，是产生了自我意识？别太天真了

不要被钟睒睒给骗了

何同学早就该翻车了

华为云双11强调价值战：华为云是打不起价格战吗？

惊！腾讯混元大模型技术负责人刘威离职，离职潮席卷“大厂”？

OpenAI o1模型炸场两个月后，Kimi对标发布国产最强新模型

刚刚！腾讯低调推出AI搜索产品ima，最大的亮点不是能搜公众号

奉劝百度，不要企图用非共识言论惊爆市场

李开复对AI为何频频指点江山？

美国OpenAI慢了！国产大模型正在海外大杀四方

突发！Kimi创始人被多家前投资方申请仲裁，国产大模型不被资本看好了？

特朗普上台，中美AI走进大爆发前夜

全网老公崩溃？八个瑞士卷怎么分？我问了问国产AI TOP10：这个AI一个都不给老婆分

“男老师造假，毁了女学生，姜萍也是受害者”

中美大模型如何追赶？李开复：缩小中美大模型差距其实很难

禁令落地！刚刚，美国宣布2025年起限制对华AI投资，香港和澳门也不例外

雷军七天骂翻全网？那个让雷军不得不回应的AI配音，究竟是怎么做出来的？

开源世界天塌了！因为美国政府制裁，Linux 内核就“清洗”了11名俄罗斯开发者

美国AI像人一样用电脑，中国AI像人一样用手机：是划时代还是伪需求？

一个美国AI大模型，让14岁男孩决定去死

重大转折！融资千万的AI公司被OPPO收购，95后创始人携核心团队集体入职

最新！美国限制对中国AI投资的规定，将在一周内发布：想要杀死国产大模型？

京东这次翻车，和百度如出一辙

百度为啥不做Sora类的视频生成？李彦宏：10年、20年都可能难以商业化应用

李开复谈中美大模型差距：很多美国朋友都认为中国会远远落后

惊了！损失超千万美元？字节大模型整个GPU集群被实习生病毒攻击，两个月的训练结果都是错的

封死最后合规渠道！微软Azure OpenAI突然终止中国个人服务，国内套壳大模型无路可走？

太蠢了！四川2.15万亿拆迁项目竟然是用 AI 生成的

见证历史！国产大模型首次在公开榜单上超过GPT-4o

百度网盘安全漏洞！女用户隐私照片被泄露，陌生男子：比我还色

烧钱结束？多家国产大模型公司放弃预训练，技术转向不丢人！

一文读懂国庆后股市行情和操作指南

官方确定三只羊录音是 AI 合成，人们为啥不相信？

估值万亿、清除异己！美国最强AI公司成功集权，OpenAI CEO奥特曼成最大赢家

会说中文，讨好中国？预告4个月后，ChatGPT终于上线了语音功能

数字铁幕！美国禁止联网汽车使用中国研发软件，《纽约时报》都看不下去了

ChatGPT 之父罕见发长文说不要怕AI，为什么国内网友反而更害怕了？

当AI学会了自我批评

蚂蚁吞大象？高通被爆将收购英特尔，或成史上最大科技并购

Kimi创始人杨植麟说出行业真相：全球人类数据都已经被AI学完了……

百度AI，骑虎难下？

阿里云新加坡大火烧了30小时，20年后也不能恢复？

突发！阿里云盘 bug 能看别人隐私照片，甚至不知道事故发生了多久…

打脸！美国OpenAI发布最新模型，李彦宏的十年预判现在就错了？

还有15项异常！阿里云电池爆炸机房着火，为啥导致字节跳动服务严重中断？

再升级！美国要求先进AI公司报告模型训练情况：防止中国使用美国最先进技术

阿里云新加坡节点突发火灾，客户业务为什么没有自动迁移？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉