DeepSeek后,阿里又出重磅

财富   2025-01-29 16:59   上海  

2025年1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。与此同时,阿里巴巴美股股价在当天收盘前半小时出现显著上涨,涨幅1%快速拉升至6.7%。

// 阿里除夕夜抛出重磅新模型 // 

1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max正式发布。据微信公众号“阿里云”消息,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。

在测试大学水平知识的MMLU-Pro、评估编程能力的LiveCodeBench、综合能力评估的LiveBench,以及近似人类偏好的Arena-Hard等多个权威评测中,该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至领先的性能。

(图片来自:阿里云微信公众号)

由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型,通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。

图片来自阿里云微信公众号)

// 或引发中国AI资产新一轮重估 // 

当天,阿里巴巴美股股价在收盘前半小时出现显著上涨,涨幅由1%快速拉升至6.7%。按市值计算,阿里巴巴市值单日市值增长143.62亿美元

而行情异动背后,是否意味着中国AI资产的重估时机已至?

日前,中国人工智能企业深度求索(DeepSeek)发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国开放人工智能研究中心(OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响波及了资本市场。就中国A股市场来看,1月27日,WindDeepSeek合作商指数大涨了10.96%,多只成分个股涨幅超过10%。

当下,国内外厂商在开闭源路线上各有侧重。比如OpenAI的GPT-4模型采用闭源模式,而Meta选择完全开源。而DeepSeek和阿里云通义团队都是开源路线的坚持者。

DeepSeek的成功也被认为是开源模型的胜利。图灵奖得主、Meta 首席人工智能科学家 Yann LeCun此前表示,对于DeepSeek的成功,其正确的理解应该是:开源模型正在超越专有模型。

LeCun 表示,DeepSeek 之所以这次一鸣惊人,是因为他们从开放研究和开源(如 Meta 的 PyTorch 和 Llama)中获益。DeepSeek 提出了新想法,并在他人工作的基础上构建。因为他们的工作是公开发布和开源的,每个人都可以从中受益,这就是开放研究和开源的力量。

阿里集团CEO吴泳铭也曾表示,“通义的开源模型在中文世界的开发者使用广泛,当开发者使用阿里云的开源模型,需要把应用部署到线上的时候,就会自然而然地选用阿里云的服务。”

而继DeepSeek之后,Qwen2.5-Max的发布无疑是中国AI阵营在高性能、低成本技术路线上的又一重要突破。有市场人士分析称,此前过度聚焦DeepSeek,却忽视了包括阿里通义在内的中国AI整体性追赶。

值得一提的是,就阿里云而言,其还有"强大模型+充足算力+完整云平台"的组合优势,或有望引发DeepSeek之后的中国AI资产新一轮重估。

(Wind综合财联社、证券时报、华尔街见闻

Wind金融终端输入命令

WBUY(万得交易快线)

一次开户,基金市场一键链接

线上批量下单,轻松多账户管理
组合资产穿透管理,实时监控底层持仓
专为机构打造
一站式基金投研、交易、管理平台


Wind万得
总部位于上海陆家嘴金融中心。
 最新文章