Qwen 2.5 开源，API 打一折

2024-09-19 02:00 广东

长话短说

就在刚刚，Qwen 开源了其最新版本模型 Qwen2.5 全家桶：

Qwen2.5: 0.5B、1.5B、3B、7B、14B、32B 和 72B
Qwen2.5-Coder：1.5B、7B 和 32B（即将发布）
Qwen2.5-Math：1.5B、7B 和 72B。

Qwen API 大降价，低至 1 折（Qwen Turbo 的输出）

进一步的

在线体验

https://huggingface.co/spaces/Qwen/Qwen2.5

API 大幅降价

Qwen-VL-Max（对比 Qwen-Max）

原价格（每千 token）

输入 0.04 元，输出 0.12 元

现价格（每千 token）

输入 0.02 元，输出 0.02 元

Qwen-Plus

原价格（每千 token）

输入 0.004 元，输出 0.012 元

现价格（每千 token）

输入 0.0008 元，输出 0.002 元

Qwen-Turbo

原价格（每千 token）

输入 0.002 元，输出 0.006 元

现价格（每千 token）

输入 0.0003 元，输出 0.0006 元

性能大为提升（来自官方）

Qwen2.5

在开源模型中，最大杯的 Qwen2.5-72B，在参数中超过众多开源模型

在 API 中，从参数上看，Qwen-Plus 显著优于 DeepSeek-V2.5，并且在与 Llama-3.1-405B 的竞争中表现出了竞争力，尽管在某些方面仍不及 GPT4-o 和 Claude-3.5-Sonnet。

对于开源的 Qwen2.5-14B 和 Qwen2.5-32B，在同等量级的模型中，颇具竞争力，如 Phi-3.5-MoE-Instruct 和 Gemma2-27B-IT。

基于 API 的 Qwen2.5-Turbo 的性能极具竞争力，同时提供了成本效益高且快速的服务。

对于小模型 Qwen2.5-3B，仅凭约 3B 参数便实现了 Llama-3 8B 的性能。

Qwen2.5-Coder

Qwen2.5-Coder 是为编程特别设计的模型，基准测试数据如下：

Qwen2.5-Coder: Base Models

Qwen2.5-Coder 最多 128K tokens 上下文，支持 92 种编程语言。

本次开源的 7B 版本 Qwen2.5-Coder，甚至打败了更大尺寸的 DeepSeek-Coder-V2-Lite 和 Codestral-20B，成为当前最强大的基础代码模型之一。

Qwen2.5-Coder-Instruct

Qwen2.5-Coder-Instruct 是 Qwen2.5-Coder 的指令微调版，在更多的评估中体现出了卓越的泛化性。

特别的，Qwen2.5-Coder-Instruct 在几个方面表现非常突出：

多语言编程能力很强

代码推理能力出色

3. 数学能力和基础能力都很强

Qwen2.5-Math

比以往模型，Qwen2.5-Math 在更大规模的数学相关数据上进行了预训练，包括由 Qwen2-Math 生成的合成数据。此外，这一次我们增加了对中文的支持，并通过赋予其进行 CoT（Chain of Thought）、PoT（Program of Thought）和 TIR（Tool-Integrated Reasoning）的能力来加强其推理能力。

Qwen2.5-Math-72B-Instruct 的整体性能超越了 Qwen2-Math-72B-Instruct 和 GPT4-o，甚至是非常小的专业模型如 Qwen2.5-Math-1.5B-Instruct 也能在与大型语言模型的竞争中取得高度竞争力的表现。

http://mp.weixin.qq.com/s?__biz=MzkzNDQxOTU2MQ==&mid=2247491671&idx=2&sn=1eaf1576c306f17e42d0d9fa184dd6ca

赛博禅心

拜AI古佛，修赛博禅心

最新文章

有文化就是不一样...「另类理解」大模型术语

来自现场：OpenAI 把实时交互，卷到了新高度

论全球化产品中的文字素养

读屏不靠截图：ChatGPT 客户端的原理、实现与边界

AI中的三门生意：修塔、搬砖和好奇心

原理解析：17岁高中生「神级 Prompt，把 Claude 强化成满血 o1」

从百度 iRAG，看 AI 分野

我在公众号里，实现了一键特效

赛博精酿｜智能体专场：月底请大家喝一杯

招人｜中国信通院：大模型数据工程研究员

零代码：一键部署 3D 模型，守护最好的坤坤

腾讯开源：3D素材生成模型、最大 MoE 模型，兼容 OpenAI SDK 方式调用

我开发了一款排版器：20秒，完成公众号排版

OpenAI 在「问啥都行」上的一些回复

10月盘点：AI 行业大事记

我开发了一款新的 AI 搜索：批量搜

深度理解提示词：人人能学会，无需硬背

革命序章：Claude 3.5 新 API，可操作电脑

细说实现：大模型是如何被投毒的

“最强”小模型：Ministral 3B/8B 发布

175 份实战手册，来自 OpenAI

AI 模型战局渐定，下一波红利在哪？

特斯拉「We, Robot」发布会总结

拆解：智谱的「深度推理/多步搜索」

搞 AI 的，包揽诺贝尔物理、化学奖

独家信息：关于 o1 的 20 个真相

像用实习生一样用 AI 辅助你编程

ChatGPT上线全新功能Canvas - 我消灭你，与你无关。

扣子最佳实践：雅思口语专家

OpenAI 凌晨发布：Realtime 实时多模态 API，及其他

PIKA1.5正式上线，他们走上了另一条全新的"整活"之路。

AIPO：校园 AI 创投活动，开放报名！

9月：AI 圈的乌龙、趣事与新闻

智谱 API ：1折

OpenAI CTO 离职，Sora 前景不明

Llama-3.2 发布：多模态，禁欧洲

字节全新发布豆包AI视频模型 - 再见了Sora，你的时代过去了。

提示工程：反复崛起，反复被死亡

Claude Prompt：方法论

智谱开源：图生视频模型 & 视频标注模型

Qwen 2.5 开源，API 打一折

参加完 OpenAI 的活动，我看到了「草莓」的隐患

o1 能带我们走进 AGI 吗？

150 行代码，复刻「草莓」，青春版支持联网

「草莓」实测：可能只是工程 Trick，且有扣费陷阱！

原理解析：李继刚老师的「汉语新解」

iPhone 16 发布，全面解读「苹果2024发布会」

小红书式爆款文案正在剿杀语文。

拒绝谣言：OpenAI 没说新模型提价

插播：Qwen 404，但不必担心

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉