小而强大!零一万物 Yi-Coder 模型震撼发布!

2024-09-09 15:22   中国香港  


前沿科技速递🚀


在 AI 迅速发展的今天,代码生成和编辑工具已经成为开发者们追求高效开发的重要利器。近日,零一万物正式开源了 Yi-Coder 系列模型,一个专为编程任务设计的强大工具,为开发者们带来了全新的生产力提升方案。无论你是代码新手还是资深开发者,Yi-Coder 都能成为你可靠的编程伙伴。


来源:传神社区
01 Yi-Coder 系列模型简介

Yi-Coder 系列模型是零一万物 Yi 系列模型家族中的“编程小能手”,提供了 1.5B 和 9B 两种参数版本。这一模型通过 2.4 万亿高质量代码语料库训练,支持 52 种编程语言,适用于代码生成、代码补全、代码翻译等多个领域。尽管 Yi-Coder 的参数量相对较小,但其性能却超越了 CodeQwen1.5 7B、CodeGeex4 9B 等同类模型,甚至能够媲美更大规模的 DeepSeek-Coder 33B。

小参数,大能量

尽管 Yi-Coder-9B 模型的参数量小于 10B,但它在各种任务中都表现出了极高的效率。从代码生成到代码补全、调试等任务,Yi-Coder 在多个评测中成绩优异,足以满足开发者们的日常需求。模型的小体积使得它易于在本地部署,尤其适合端侧应用,开发者们可以轻松将其集成到自己日常使用的编程工具中。

128K 长序列建模

复杂的项目往往伴随着大量代码文件之间的依赖关系,Yi-Coder 的长序列建模能力允许它处理长达 128K tokens 的上下文内容。在这样的情况下,Yi-Coder 依旧能够高效捕捉代码中的长期依赖关系,使其在跨文件代码补全和复杂项目级代码理解中表现突出。

强大的代码生成和补全能力

Yi-Coder 支持 52 种主要编程语言,涵盖了从 Python 到 Java 的主流开发语言。通过结合更长的上下文建模,Yi-Coder 不仅能够完成高质量的代码生成,还能精准地完成跨文件的代码补全任务,为开发者节省了大量手动查找和填写代码的时间。

02 模型表现如何?数据告诉你!

LiveCodeBench:Yi-Coder-9B-Chat 在 LiveCodeBench 评测平台上的通过率高达 23.4%,成为唯一一个在 10B 参数以下的模型中通过率超过 20% 的产品。它甚至超越了 CodeGeex4 和 DeepSeek-Coder 等高参数模型。

基准测试:在 HumanEval 和 MBPP 等流行的代码生成和推理任务中,Yi-Coder-9B-Chat 也表现突出,分别达到了 85.4% 和 73.8% 的通过率,并且是首个在 CRUXEval-O 基准测试中通过率超过 50% 的开源模型。

代码编辑和跨文件代码补全:CodeEditorBench 涵盖了四个关键领域:代码调试、代码翻译、代码优化和代码需求转换。结果表明,在开源代码大语言模型中,Yi-Coder-9B-Chat 取得了优异的成绩,在 Primary 和 Plus 两个子集中始终优于 DeepSeek-Coder-33B-Instruct 和 CodeQwen1.5-7B-Chat。

 CrossCodeEval 基准测试中,Yi-Coder 在有检索和无检索上下文的情况下都表现优异,展现了强大的代码补全能力,尤其适合处理跨文件依赖的代码库。

长序列建模表现优秀:零一万物效仿文本领域流行的长序列评测,合成了一个 128K 长序列的“Needle in the code” 评估任务,长度双倍于 CodeQwen1.5 所构建的 64K 长序列评测。它通过在长代码库中随机插入一个简单的自定义函数,测试模型能否在代码库最后重复这个函数。该测试旨在检测模型 LLM 是否能从长文本中提取出这些关键信息,从而反映 LLM 其对长文本的理解基础能力。

下图全绿结果表示,Yi-Coder-9B 在 128K 长度范围内完美完成了这一任务。


数学推理能力:Yi-Coder 还可以通过编程解决复杂的数学推理问题。在代码辅助解题的测试中,Yi-Coder-9B 的准确率达到 70.3%,远超同类模型。

03 使用实例

当我让模型编写一个快排算法时,输出如下:

04 模型下载

传神社区:

https://opencsg.com/models/01AI/Yi-Coder-1.5B

https://opencsg.com/models/01AI/Yi-Coder-1.5B-Chat

https://opencsg.com/models/01AI/Yi-Coder-9B

https://opencsg.com/models/01AI/Yi-Coder-9B-Chat

blog:

https://01-ai.github.io/





欢迎加入传神社区



•贡献代码,与我们一同共建更好的OpenCSG


•Github主页

欢迎🌟:https://github.com/OpenCSGs


•Huggingface主页

欢迎下载:https://huggingface.co/opencsg


•加入我们的用户交流群,分享经验



扫描上方二维码添加传神小助手






“      关于OpenCSG

开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。


关注OpenCSG

加入传神社区



传神社区
该账号是开放传神(OpenCSG)分享大模型的技术、见解、传神开放社区等方面的内容!
 最新文章