Qwen2.5-Max发布，性能超越DeepSeek V3

科技 2025-01-31 10:21 安徽

近日，超大规模的 MoE 模型（混合专家模型）通义千问 Qwen2.5-Max 正式上线，通义千问团队使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。

通义千问团队表示，“今天，我们很高兴能给大家分享 Qwen2.5-Max 目前所取得的成果。大家可以在Qwen Chat 直接体验，或是通过阿里云百炼平台调用 API 服务。”

同时，通义千问还将 Qwen2.5-Max 与业界领先的模型（无论是闭源还是开源）在一系列广受关注的基准测试上进行了对比评估。这些基准测试包括测试大学水平知识的 MMLU-Pro、评估编程能力的 LiveCodeBench，全面评估综合能力的 LiveBench，以及近似人类偏好的 Arena-Hard。评估结果涵盖了基座模型和指令模型的性能得分。

首先，通义千问直接对比了指令模型的性能表现。指令模型即我们平常使用的可以直接对话的模型。通义千问将 Qwen2.5-Max 与业界领先的模型（包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet）的性能结果进行了对比。

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现领先。同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中，由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型，通义千问将 Qwen2.5-Max 与目前领先的开源 MoE 模型 DeepSeek V3、最大的开源稠密模型 Llama-3.1-405B，以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。

对比结果如下图所示：

通义千问的基座模型在大多数基准测试中都展现出了显著的优势。“我们相信，随着后训练技术的不断进步，下一个版本的 Qwen2.5-Max 将会达到更高的水平。”

通义千问表示，将持续提升数据规模和模型参数规模能够有效提升模型的智能水平。“接下来，我们将持续探索，除了在预训练的 scaling 继续探索外，将大力投入强化学习的 scaling，希望能实现超越人类的智能，驱动 AI 探索未知之境。”

编辑：芯智讯-浪客剑

往期精彩文章

ASML营收创历史新高：中国大陆净系统销售占比跌至27%！

DeepSeek掀起AI算力革命：英伟达暴跌17%！台积电暴跌13%！

Q1财测不及预期，股价大跌7.5%！TI 回应在华倾销被调查传闻

传瑞芯微前副总经理陈锋将加盟安谋科技！

传台积电6万片晶圆报废！内部人士回应

传字节跳动今年将采购240亿元国产AI芯片！

瑞芯微副总经理陈锋辞职！

寒武纪遭前CTO梁军索赔42.9亿元！

黄仁勋宴请35位供应链大佬：每桌菜价约1182元！

前华为悍将李健出任荣耀CEO！赵明：选择放手和离开！

全栈自研！又一家国产GPU厂商启动IPO！引发“寒王”暴跌？

美国将算能/智谱/科益虹源等25家中企列入实体清单！

详解美国对华晶圆代工限制新规（附完整规则）

荷兰宣布对特定测量和检测设备出口管制！

行业交流、合作请加微信：icsmart01
芯智讯官方交流群：221807116

芯智讯

“芯智讯”——有料的科技新媒体！专注于半导体产业链、智能手机产业链、人工智能、AR/VR、智能硬件及汽车电子等相关领域。

最新文章

涉嫌垄断，市场监管总局对谷歌立案调查！

OpenAI CEO：不会起诉DeepSeek，将会以实力取胜！

传台积电将在台南建6座晶圆厂：3座1nm，3座0.7nm

Cerebras CEO：DeepSeek引发企业客户对其AI芯片需求暴增！

泰瑞达收购英飞凌自动化测试设备团队

恩智浦2024年营收126.1亿元，同比下滑5%

英特尔Nova Lake系列曝光：CPU核心最多16个P核+32个E核

AMD MI400曝光：集成8个加速计算芯片和独立多媒体I/O芯片

鸿海GB200 AI服务器放量出货，已完成英伟达交付目标

通过新加坡获取了AI芯片？美国对DeepSeek展开调查：英伟达回应！

OpenAI CEO罕见认错：DeepSeek是非常好的模型，将考虑跟进开源！

黄仁勋与特朗普会面讨论了哪些内容？

英特尔Gaudi 2D AI加速器针对DeepSeek Janus Pro模型进行优化

净利暴跌63%！ST计划关厂并裁员3000人！

苹果2025Q1营收创历史新高，大中华区同比下滑11%

DeepSeek引发多方调查，传美国拟对华禁售英伟达H20芯片！

Qwen2.5-Max发布，性能超越DeepSeek V3

英特尔四季度营收142.6亿美元，同比转盈为亏

意法半导体四季度净利3.41亿美元，同比暴跌68.4%！

ASML营收创历史新高：中国大陆净系统销售占比跌至27%！

“半导体离开我们去了台湾！”特朗普威胁加征100%关税！

黄仁勋发内部信评论DeepSeek？内部人士：胡扯！

DeepSeek掀起AI算力革命：英伟达暴跌17%！台积电暴跌13%！

Q1财测不及预期，股价大跌7.5%！TI 回应在华倾销被调查传闻

DeepSeek创始人专访：中国的AI不可能永远跟随！

思特威预计2024年净利暴涨2512%-2830%

1万亿元！提供专项综合金融支持，助力人工智能产业链发展

总投资10亿元，京东方珠海晶芯Mini LED生产线正式投产

定价6.6亿元，闻泰科技向立讯转让3家子公司100%股权

LG新能源计划建全固态电池中试线，2025年资本支出削减30%

塔塔电子收购和硕印度iPhone代工厂60%股份

传瑞芯微前副总经理陈锋将加盟安谋科技！

TCL科技：2024年半导体显示业务净利润将超60亿元

荷兰首相：对华半导体限制政策与美国保持一致！

联发科正利用AI驱动的Cadence工具设计2nm芯片，效率提升30%

台积电大部分产线23日恢复，联电24日复工！

总投资30亿美元，Dixon与惠科合资8.6代显示器工厂将在印度开建

日本研发基于木基材料的光刻胶，可满足2nm制程需求

传台积电6万片晶圆报废！内部人士回应

2.5亿美元！HTC将部分XR资产出售给谷歌

SK海力士2024年营收暴涨102%，创历史新高！

三星晶圆代工部门2025年资本支出大砍50%！

全志科技2024年净利或将暴涨727.42%

汇顶科技2024年净利或同比暴涨287.75%

三星Galaxy S25系列发布：标配骁龙8至尊版，定价799美元起

英特尔前CEO基辛格投资英国AI芯片公司Fractile.ai

传字节跳动今年将采购240亿元国产AI芯片！

瑞芯微副总经理陈锋辞职！

SK海力士拟发放巨额奖金：18.7个月工资！

传台积电南科厂因地震导致1至2万片晶圆破损

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉