小而强大！零一万物 Yi-Coder 模型震撼发布！

2024-09-09 15:22 中国香港

前沿科技速递🚀

在 AI 迅速发展的今天，代码生成和编辑工具已经成为开发者们追求高效开发的重要利器。近日，零一万物正式开源了 Yi-Coder 系列模型，一个专为编程任务设计的强大工具，为开发者们带来了全新的生产力提升方案。无论你是代码新手还是资深开发者，Yi-Coder 都能成为你可靠的编程伙伴。

来源：传神社区

01 Yi-Coder 系列模型简介

Yi-Coder 系列模型是零一万物 Yi 系列模型家族中的“编程小能手”，提供了 1.5B 和 9B 两种参数版本。这一模型通过 2.4 万亿高质量代码语料库训练，支持 52 种编程语言，适用于代码生成、代码补全、代码翻译等多个领域。尽管 Yi-Coder 的参数量相对较小，但其性能却超越了 CodeQwen1.5 7B、CodeGeex4 9B 等同类模型，甚至能够媲美更大规模的 DeepSeek-Coder 33B。

小参数，大能量

尽管 Yi-Coder-9B 模型的参数量小于 10B，但它在各种任务中都表现出了极高的效率。从代码生成到代码补全、调试等任务，Yi-Coder 在多个评测中成绩优异，足以满足开发者们的日常需求。模型的小体积使得它易于在本地部署，尤其适合端侧应用，开发者们可以轻松将其集成到自己日常使用的编程工具中。

128K 长序列建模

复杂的项目往往伴随着大量代码文件之间的依赖关系，Yi-Coder 的长序列建模能力允许它处理长达 128K tokens 的上下文内容。在这样的情况下，Yi-Coder 依旧能够高效捕捉代码中的长期依赖关系，使其在跨文件代码补全和复杂项目级代码理解中表现突出。

强大的代码生成和补全能力

Yi-Coder 支持 52 种主要编程语言，涵盖了从 Python 到 Java 的主流开发语言。通过结合更长的上下文建模，Yi-Coder 不仅能够完成高质量的代码生成，还能精准地完成跨文件的代码补全任务，为开发者节省了大量手动查找和填写代码的时间。

02 模型表现如何？数据告诉你！

LiveCodeBench：Yi-Coder-9B-Chat 在 LiveCodeBench 评测平台上的通过率高达 23.4%，成为唯一一个在 10B 参数以下的模型中通过率超过 20% 的产品。它甚至超越了 CodeGeex4 和 DeepSeek-Coder 等高参数模型。

基准测试：在 HumanEval 和 MBPP 等流行的代码生成和推理任务中，Yi-Coder-9B-Chat 也表现突出，分别达到了 85.4% 和 73.8% 的通过率，并且是首个在 CRUXEval-O 基准测试中通过率超过 50% 的开源模型。

代码编辑和跨文件代码补全：CodeEditorBench 涵盖了四个关键领域：代码调试、代码翻译、代码优化和代码需求转换。结果表明，在开源代码大语言模型中，Yi-Coder-9B-Chat 取得了优异的成绩，在 Primary 和 Plus 两个子集中始终优于 DeepSeek-Coder-33B-Instruct 和 CodeQwen1.5-7B-Chat。

CrossCodeEval 基准测试中，Yi-Coder 在有检索和无检索上下文的情况下都表现优异，展现了强大的代码补全能力，尤其适合处理跨文件依赖的代码库。

长序列建模表现优秀：零一万物效仿文本领域流行的长序列评测，合成了一个 128K 长序列的“Needle in the code” 评估任务，长度双倍于 CodeQwen1.5 所构建的 64K 长序列评测。它通过在长代码库中随机插入一个简单的自定义函数，测试模型能否在代码库最后重复这个函数。该测试旨在检测模型 LLM 是否能从长文本中提取出这些关键信息，从而反映 LLM 其对长文本的理解基础能力。

下图全绿结果表示，Yi-Coder-9B 在 128K 长度范围内完美完成了这一任务。

数学推理能力：Yi-Coder 还可以通过编程解决复杂的数学推理问题。在代码辅助解题的测试中，Yi-Coder-9B 的准确率达到 70.3%，远超同类模型。

03 使用实例

当我让模型编写一个快排算法时，输出如下：

04 模型下载

传神社区：

https://opencsg.com/models/01AI/Yi-Coder-1.5B

https://opencsg.com/models/01AI/Yi-Coder-1.5B-Chat

https://opencsg.com/models/01AI/Yi-Coder-9B

https://opencsg.com/models/01AI/Yi-Coder-9B-Chat

blog：

https://01-ai.github.io/

欢迎加入传神社区

•贡献代码，与我们一同共建更好的OpenCSG

•Github主页

欢迎🌟：https://github.com/OpenCSGs

•Huggingface主页

欢迎下载:https://huggingface.co/opencsg

•加入我们的用户交流群，分享经验

扫描上方二维码添加传神小助手

“ 关于OpenCSG

开放传神（OpenCSG）成立于2023年，是一家致力于大模型生态社区建设，汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。

关注OpenCSG

加入传神社区

http://mp.weixin.qq.com/s?__biz=MzkxNTYxMjU1Mw==&mid=2247486603&idx=1&sn=b9540fd09964c817127a46d3a31701b6

传神社区

该账号是开放传神（OpenCSG）分享大模型的技术、见解、传神开放社区等方面的内容！

最新文章

OpenCoder：开源代码大模型，推动编程AI的未来

CodeSouler v1.11.0 版本更新

倒计时2天！大模型全生命周期管理与AI应用的全栈可观测性圆桌议题公布

CSGHub All-in-One Docker 快速部署

重磅揭秘！Auto CSGHub内测视频曝光 | 国产版 HuggingFace+ 引领智能化升级

算力补贴累计超亿元！模速空间“浓缩”上海大模型产业链

报名开始｜《大模型全生命周期管理与AI应用的全栈可观测性》上海站

微软OmniParser：一切皆文档，OCR驱动智能操作

从文本到动态视频：Allegro模型让创意更轻松

传神论文中心｜第30期人工智能领域论文推荐

超快速，高性能！Meta发布移动端MobileLLM

DataFlow v202410 版本更新一站式数据处理平台

OpenCSG与传神社区的创新瞬间

OpenCSG传神社区月度功能更新

突破语言壁垒：Cohere 发布多语言大模型 Aya Expanse

Stable Diffusion 3.5震撼发布：三大版本满足多层次AI图像生成需求

OpenCSG携手书生·浦语：InternLM2.5-20B-Chat 正式上线，共建AI未来新生态

课程升级、资源加码！万人共学的书生大模型实战营第4期正式起航！

无需依赖闭源模型！司南CompassJudger为AI评测带来新选择

CSGHub SaaS快速入门指南

Mochi 1视频生成模型亮相：动作流畅，开放源代码

课程升级、资源加码！万人共学的书生大模型实战营第4期正式起航！

传神论文中心｜第29期人工智能领域论文推荐

重磅升级 | OpenCSG开源中文版fineweb edu v2数据集

英伟达推出Nemotron-70B：强大开源语言模型，基准测试中全面领先！

直播预告｜未来视界：多模态AI的创新与挑战

苹果开源Depth Pro：0.3秒实现从2D图像到3D深度图的革命性突破

传神论文中心｜第28期人工智能领域论文推荐

2B参数搞定高质量视频！北大&快手携手打造Pyramid Flow

直播预告｜当A股疯涨挑战经典金额理论，大模型能否作为一个“理性投资人”？

CodeSouler v1.0.8 版本更新

传神论文中心｜第27期人工智能领域论文推荐

OpenCSG传神社区月度功能更新

OpenCSG开源数据集再次登顶HF数据榜

OpenCSG DataFlow：锻造大模型智慧的炼金术，开启数据集Agentic新范式

微软推出GRIN-MoE：开创专家路由新范式

Llama 3.2：轻量级设计与多模态能力

英伟达发布NVLM 1.0：屠榜多模态任务，纯文本性能逆势提升

高效、精准、智能：GOT-OCR2.0引领OCR 2.0时代

传神论文中心｜第26期人工智能领域论文推荐

超越极限！Qwen2.5 助力多领域智能应用

年度巨献 | OpenCSG开源最大中文合成数据集Chinese Cosmopedia

CSGHub开源版本v0.9.0更新

传神论文中心｜第25期人工智能领域论文推荐

Mistral AI再创新高，Pixtral 12B多模态模型强势来袭

CodeSouler v1.0.7 版本更新

重磅发布！DeepSeek-V2.5：融合通用与代码能力的全新开源模型

小而强大！零一万物 Yi-Coder 模型震撼发布！

国产“小钢炮”MiniCPM3-4B：小参数，大能量！

国内独家首发 | OpenCSG开源中文版fineweb edu数据集

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉