DeepSeek后,阿里又出重磅!

文摘   2025-01-30 11:18   江苏  

来源:Wind综合财联社、证券时报、华尔街见闻 


2025年1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。与此同时,阿里巴巴美股股价在当天收盘前半小时出现显著上涨,涨幅1%快速拉升至6.7%。

// 阿里除夕夜抛出重磅新模型 // 

1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。据微信公众号“阿里云”消息,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。

在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、综合能力评估的LiveBench,以及近似人类偏好的Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至领先的性能。

(图片来自:阿里云微信公众号)

由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型,通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。

图片来自阿里云微信公众号)

北美人工智能
关注人工智能发展趋势 依托北美科技创新理念 为创业者实现梦想
 最新文章