见证历史!国产大模型首次在公开榜单上超过GPT-4o

科技   2024-10-17 19:35   北京  

前不久,“大模型六小强”之一的零一万物还在被传放弃了预训练大模型,结果昨天直接就丢下了一个重磅“炸弹”。

10月16日上午,零一万物在线上举办的新品发布会上,正式发布自家全新旗舰大模型“Yi-Lightning”。Lighting直译为闪电,意思应该是新模型的推理速度进一步提升。

在国际权威盲测榜单 LMSYS 上,Yi-Lightning 干掉了 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet,排名世界第六,中国第一。

第一,LMSYS确实是国际权威盲测榜单,不是野鸡排行榜。

之前很多人嘲讽国产大模型就会刷榜,做一些开卷考试题,但是这次零一万物参与的这个榜单确实具有权威性。

LMSYS Org作为一个公开性质的研究团体,源自学术界的强强联合,由加州大学伯克利分校、加州大学圣地亚哥分校以及卡耐基梅隆大学的学生与教职员工共同组建。LMSYS Org 推出的Chatbot Arena凭借其创新的“实战竞技”模式与测试团队的严格标准,迅速赢得了全球行业的广泛认可。

而且,这个盲测结果来自全球累积超千万次的人类用户投票。

就连OpenAI在正式揭晓GPT-4o之前,也是选择在LMSYS平台上进行了匿名预测试,足见对其信任与依赖。

前段时间大模型竞技场还更新了规则,新榜单对AI回答的长度和风格等特征做了降权处理,这样大模型就不能光靠格式和长度来增加分数了,得分更加看重模型真正解决问题的能力。

第二,只有模型能力和成本问题能够被逐步解决,基于AI的商业生态才能真正健康地发展。

李开复强调,“要激活一个健康的生态系统,关键在于拥有顶级的模型,并且这些模型的价格要足够低,以促进应用的发展。如果模型太贵,可能会导致应用开发公司破产。”

“关键在于,如果好的模型价格过高,应用就无法迅速普及,也就无法实现普惠。我们今天发布的模型,希望能够让我们更接近这一愿景。”

零一万物最新模型的价格是0.99元人民币/百万 token,有人认为零一万物这是参与了价格战,但是李开复不这么认为。

李开复解释道,0.99/百万 token 的价格看似卷起来了,但实际应用中,调用量累积下来还是很大,因此需要把价格平衡在一个适当的区间,「不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润」,以保证开发者能在用上优秀模型的前提下,再去挑最便宜的。

第三,李开复帮六小龙辟了谣:预训练的钱,头部公司都付得起。

李开复说:据我所知,这六家公司融资额度都是够的,我们做预训练的production run,训练一次三四百万美金,这个钱也是头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。

最后,李开复博士之前曾表示不会从事亏损的To B业务,但是这次发布会零一万物还发布了面向ToB市场的首款产品——AI 2.0数字人,为零售和电商场景设计,也就是说在探索To B市场。

对此,李开复的说法是:我们觉得这样的to B工作只能在中国做,因为要触达美国的用户或国外的用户不太可能,所以全世界的范畴来说,to B供应商基本都是当地的,即便在中国要买SAP的产品也是SAP中国卖给你,所以跨国的设立分公司做to B绝对不是我们或其他的创业公司能做的,所以to B的国外就放弃了,做to B就做国内,做to B就做有利润的解决方案,而不只是卖模型,不只是做项目制,这是我们to B的做法。

现在看,李开复博士对于做AI充满了信心,甚至对整个AI六小龙都充满信心,这是好事儿。毕竟国产大模型要想跑出一个第一名来,不是六小龙,就是大厂。

只有国产大模型做好了,我们这些用户才能用到好的产品。

盼人好,是一种美德。

数字进化岛
洞察科技产业,透视全球真相。
 最新文章