今日开源(2024-09-05):零一万物Yi-Coder代码生成系列模型,提供1.5B、9B,支持128K上下文

文摘   2024-09-05 17:58   美国  


🏆 基座模型

①项目:Yi-Coder

零一万物开源 Yi-Coder 代码生成系列模型,提供 1.5B 和 9B 两种参数,每种参数包含基础和聊天模型版本。Yi-Coder支持128K上下文,其中,Yi-Coder-9B 在 Yi-9B 的基础上增加了 2.4T 高质量 token,这些 token 均精心来源于 GitHub 上的存储库级代码语料库和从 CommonCrawl 中筛选出的代码相关数据。Yi-Coder-9B 的表现优于其他 10B 参数以下的模型,如 CodeQwen1.5 7B 和 CodeGeex4 9B,甚至能够与 DeepSeek-Coder 33B 相媲美。

☆一键收藏:

https://sota.jiqizhixin.com/project/yi-coder


🤖 Agent开发

①项目:TinyAgent

★TinyAgent 旨在实现小型语言模型 (SLM) 中的复杂推理和函数调用功能,这些模型可以安全且私密地部署在边缘设备。TinyAgent 通过使用高质量、精选的数据训练专门的 SLM 并专注于使用LLMCompiler进行函数调用来解决这些挑战。作为驱动应用程序,TinyAgent 可以与各种 MacOS 应用程序交互,帮助用户完成日常任务,例如撰写电子邮件、管理联系人、安排日历事件和组织 Zoom 会议。

☆一键收藏:

https://sota.jiqizhixin.com/project/tinyagent


🛠️必备工具

①项目:RapidLayoutRecover

★RapidLayoutRecover 是一个针对文档类图像的项目,整合了版面分析、文字识别、表格识别和公式识别的结果,能够还原文档的版面布局信息。该项目可以将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。

☆一键收藏:

https://sota.jiqizhixin.com/project/rapidlayoutrecover


②项目:GuideLLM

★GuideLLM 是一个强大的工具,用于评估和优化大语言模型(LLM)的部署。通过模拟真实世界的推理工作负载,GuideLLM 帮助用户评估在各种硬件配置下部署 LLM 的性能、资源需求和成本影响。该方法确保了高效、可扩展和成本效益高的 LLM 推理服务,同时保持高服务质量。

☆一键收藏:

https://sota.jiqizhixin.com/project/guidellm


③项:real_world_prompting

★Anthropic推出的一个综合性实用提示(prompting)教程,旨在帮助有经验的开发者深入了解提示工程。项目包括五个课程,内容涵盖了如何将关键提示技术融入复杂的实际应用提示中。

☆一键收藏:

https://sota.jiqizhixin.com/project/real-world-prompting


④项目:AlphaNLHoldem

★AlphaNLHoldem 是一个非官方的 AlphaHoldem 实现,使用 TensorFlow 和 Ray 构建的 1v1 无限制德州扑克 AI。该项目旨在提供一个干净的代码库,用于在类似 Holdem 的游戏中应用自我对弈的无模型强化学习方法,并尝试重现 AlphaHoldem 的结果。

☆一键收藏:

https://sota.jiqizhixin.com/project/alphanlholdem


👋网页端访问:https://sota.jiqizhixin.com

欢迎扫码加入社群
交流LLM推理与微调、Agent/RAG应用构建开发经验


机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章