Qwen AI 革命性编程助手:阿里巴巴引爆开发者圈

文摘   科技   2024-11-13 10:04   上海  



近日,阿里巴巴旗下的 Qwen AI 部门发布了一系列名为 Qwen-2.5-Coder 的强大新模型,这些模型专为软件开发设计,旨在助力开发者编写、分析并理解代码。此举不仅标志着阿里巴巴在 AI 领域的又一次重大突破,更有望彻底改变软件开发行业的未来。


模型性能卓越,超越其他开源系统

Qwen-2.5-Coder 系列包含六种不同规模的模型,参数从0.5亿到320亿不等,能够灵活应对各种使用场景和计算需求。其中,最大的模型 Qwen-2.5-Coder-32B-Instruct 在代码生成基准测试中表现尤为出色,甚至超越了其他开源系统,如 DeepSeek-Coder 和 Codestral。

在逻辑推理和语言理解等一般任务中,该模型也展现出了强大的实力,尽管在部分基准测试中仍稍逊于 GPT-4o,但其整体性能已经相当惊人。


两大应用测试,验证模型实用性

为了验证这些模型的实用性,Qwen 在两个实际应用中进行了测试:AI 驱动的代码编辑器 Cursor 和一个与 ChatGPT 或 Claude 类似的、支持 artifact 的基于 Web 的聊天机器人。

测试结果显示,这些模型能够显著提高开发者的编码效率和质量。阿里巴巴还计划很快将其聊天机器人功能整合到其 Tongyi 云平台中,为更多用户提供便捷的编程支持。


海量训练数据,奠定坚实基础

值得一提的是,Qwen-2.5-Coder 系列模型在训练数据上也下足了功夫。这些模型在两大来源的超过20万亿个token的数据上进行训练,包括去年9月推出的 Qwen 2.5 通用数据混合集中的18.5万亿个token,以及来自公共源代码和与编程相关的 Web 内容的5.5万亿个token。这使得 Qwen-2.5-Coder 系列成为首个训练token超过20万亿的开源模型,为其在代码生成和分析方面的卓越表现奠定了坚实的基础。


支持多种编程语言,满足广泛需求

顶级模型 Qwen-2.5-Coder-32B-Instruct 还支持超过40种编程语言,从常见的 Python、Java 和 JavaScript 到专业的 Haskell 和 Racket 等,几乎涵盖了开发者可能遇到的所有编程语言。所有模型均具备最多128,000 tokens 的上下文窗口,能够处理复杂的编程场景。

Qwen2.5-Coder-32B-Instruct 在 40 多种编程语言中显示出强大的通用性和性能。特别是在 Haskell 和 Racket 等函数式语言中,该模型凭借其优化的训练数据显示出了自己的优势。(图源:Qwen)


开源发布,激发开发者热情

阿里巴巴已在 GitHub 上以 Apache 2.0 许可证发布了除30亿参数版本外的所有模型,开发者可以通过 Hugging Face 的免费演示轻松测试这些模型。

这一举措无疑将激发更多开发者对 Qwen-2.5-Coder 系列模型的兴趣和热情,推动其在软件开发行业中的广泛应用。


结语

随着 Qwen AI 在代码编写与分析领域的不断深耕,我们有理由相信,未来的软件开发将更加智能化、高效化。Qwen-2.5-Coder 系列模型的发布,不仅为开发者提供了强大的工具支持,更为整个行业的发展注入了新的活力和动力。让我们共同期待 Qwen AI 在未来带给我们更多的惊喜和突破!


欢迎留言、点赞、转发!

阿里巴巴相关报道
看懂世界:阿里推出全新视觉语言模型 Qwen2-VL



图文收集自网络,非本号观点;如有侵权,请联系删除

更多AI热点资讯,请每日关注AI今说~

AI今说
每天发布AI相关资讯,让您了解AI世界的最新发展。同时,周一至周五关注AI在社会各领域的应用与发展(论文解读)。
 最新文章