重磅!阿里发布通义千问新一代开源模型Qwen2.5,旗舰模型Qwen2.5-72B性能超越Llama 405B

科技   2024-09-20 10:07   北京  

点击上方关注 “终端研发部

设为“星标”,和你一起掌握更多数据库知识        


论国内大模型,还得是阿里

这回全家桶齐全,Qwen2.5 全家桶果然是吊的一批,这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型

其涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型:

  • Qwen2.5: 0.5B、1.5B、3B、7B、14B、32B 和 72B

  • Qwen2.5-Coder:1.5B、7B 和 32B(即将发布)

  • Qwen2.5-Math:1.5B、7B 和 72B。

Qwen2.5系列性能测试


先看一下,这张截图

尽管Qwen2.5的参数规模仅为720亿,却在多项基准测试中超越了Meta的4050亿参数开源Llama-3.1模型,以及Mistral的最新Large-V2模型,成为当前最强的开源模型之一。


多模态模型方面,广受期待的视觉语言模型Qwen2-VL-72B正式开源,Qwen2-VL能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。


日前权威测评LMSYS Chatbot Arena Leaderboard发布最新一期的视觉模型性能测评结果,Qwen2-VL-72B成为全球得分最高的开源模型。

2.5到底有什么亮点呢

1、有着更大的数据集

Qwen2.5语言模型通过在18T tokens大规模数据集上的预训练,相较于前代Qwen2,在知识(MMLU:85+)、编程(HumanEval 85+)和数学能力(MATH 80+)方面取得显著提升。

2、支持更强的指令遵循能力

新模型增强了指令遵循能力,包括执行复杂指令、生成长文本(>8K标记)、处理结构化数据和生成JSON等结构化输出,对各种system prompt适应性更强,提升了角色扮演和聊天机器人的条件设置功能。

3、更强的文本能力

Qwen2.5支持长达128K tokens的长文本生成,多语言能力覆盖29种以上语言。专业领域如编程(Qwen2.5-Coder)和数学(Qwen2.5-Math)的模型能力也得到增强,特别是在编程评估和数学推理方法的整合上。

4、多种语言支持

同时,Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法


Qwen2.5-3B作为这一趋势的代表,凭借约30亿参数便展现出卓越性能,凸显了其相较于先前模型的高效能和强大实力。


目前的累计下载量已突破4000万,成为仅次于Llama的世界级模型群

果然,论大模型,阿里也是煞费苦心了!



回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复 【SpringCloud】获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

阅读更多


用 Spring 的 BeanUtils 前,建议你先了解这几个坑!

lazy-mock ,一个生成后端模拟数据的懒人工具

在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!

字节跳动一面:i++ 是线程安全的吗?

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)


相信自己,没有做不到的,只有想不到的

在这里获得的不仅仅是技术!


喜欢就给个“在看 

互联网科技小于哥
大家好,我是小于哥呀 1、在这里已经为1000+人,提供专业的求职/技术咨询。 2、每天持续干货输出,同时也做专业面试指AI相关的知识,多次受邀成为圆桌嘉宾; 3、每天持续分享互联网,科技,开发技术,毕设和AI相关的知识,同时也做专业面试指
 最新文章