今日开源(2024-09-10):DeepSeek-Coder-V2最新版本发布,精通338种编程语言,上下文支持128K

文摘   2024-09-10 17:16   云南  


🏆 基座模型

①项目:DeepSeek-Coder-V2-Instruct-0724

DeepSeek 发布了他们的 DeepSeek-Coder-V2-Instruct-0724,它在 Aider LLM 排行榜上排名第2,击败了 DeepSeek V2.5。DeepSeek-Coder-V2 是一个开源的 Mixture-of-Experts (MoE) 代码语言模型,在代码特定任务中表现可与 GPT4-Turbo 相媲美。该模型从 DeepSeek-V2 的中间检查点进一步预训练,增加了 6 万亿个tokens,显著增强了编码和数学推理能力,同时在一般语言任务中保持了相当的性能。支持的编程语言从 86 种扩展到 338 种,上下文长度从 16K 扩展到 128K。

☆一键收藏:

https://sota.jiqizhixin.com/project/deepseek-v2


🤖 Agent开发

项目:CodeFuse-muAgent

★CodeFuse-muAgent 是一个由知识图谱引擎驱动的创新代理框架,结合了多代理、函数调用、代码解释器等技术。通过画布拖拽和简单的文本编写,大语言模型可以在人工指导下执行各种复杂的标准操作程序。该框架已在蚂蚁集团的多个复杂DevOps场景中得到验证。

☆一键收藏:

https://sota.jiqizhixin.com/project/codefuse-muagent


🛠️框架平台、必备工具

①项目:Anything-LLM

★AnythingLLM 是一个全栈应用程序,允许用户将任何文档、资源或内容转化为上下文,以便在聊天时供任何大型语言模型(LLM)使用。该应用程序支持选择和使用不同的 LLM 或向量数据库,并支持多用户管理和权限设置。用户可以在本地运行或远程托管,智能地与提供的任何文档进行对话。

☆一键收藏:

https://sota.jiqizhixin.com/project/anythingllm


②项目名称:Flux Gym

★Flux Gym 是一个简单的 Web UI,用于在低显存(12GB/16GB/20GB)环境下训练 FLUX LoRA。前端基于 AI-Toolkit 的 Gradio UI,后端由 Kohya Scripts 提供支持。该项目旨在结合 AI-Toolkit WebUI 的简便性和 Kohya Scripts 的灵活性,提供一个易于使用且可扩展的 LoRA 训练界面

☆一键收藏:

https://sota.jiqizhixin.com/project/fluxgym


③项目名称:KubeAI

★KubeAI 是一个在 Kubernetes 上运行的私有化 OpenAI 替代方案。它支持多种开源模型(如 LLMs、Whisper 等),并提供与 OpenAI 兼容的 API。KubeAI 具有多平台支持(CPU、GPU),并能根据负载自动扩展。项目还包含一个聊天界面(OpenWebUI)和消息集成功能(如 Kafka、PubSub)。

☆一键收藏:

https://sota.jiqizhixin.com/project/kubeai


④项目名称:Tomato

★Tomato 是一个概念验证的隐写术工具利用最小熵耦合(MEC)技术将加密消息隐藏在自然语言中。该项目通过将隐藏消息的概率分布与LLM生成的覆盖文本的分布相结合,确保嵌入的消息在统计上与自然语言文本一致,从而使隐藏消息难以被检测到。

☆一键收藏:

https://sota.jiqizhixin.com/project/tomato


👋网页端访问:https://sota.jiqizhixin.com

欢迎扫码加入社群
交流LLM推理与微调、Agent/RAG应用构建开发经验


机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章