来源:Wind综合财联社、证券时报、华尔街见闻
2025年1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。与此同时,阿里巴巴美股股价在当天收盘前半小时出现显著上涨,涨幅1%快速拉升至6.7%。
// 阿里云除夕夜抛出重磅新模型 //
1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。据微信公众号“阿里云”消息,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。
在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、综合能力评估的LiveBench,以及近似人类偏好的Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至领先的性能。
(图片来自:阿里云微信公众号)
由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型,通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。
(图片来自:阿里云微信公众号)