🏆 基座模型
①项目:DeepSeek-Coder-V2-Instruct-0724
★DeepSeek 发布了他们的 DeepSeek-Coder-V2-Instruct-0724,它在 Aider LLM 排行榜上排名第2,击败了 DeepSeek V2.5。DeepSeek-Coder-V2 是一个开源的 Mixture-of-Experts (MoE) 代码语言模型,在代码特定任务中表现可与 GPT4-Turbo 相媲美。该模型从 DeepSeek-V2 的中间检查点进一步预训练,增加了 6 万亿个tokens,显著增强了编码和数学推理能力,同时在一般语言任务中保持了相当的性能。支持的编程语言从 86 种扩展到 338 种,上下文长度从 16K 扩展到 128K。
☆一键收藏:
https://sota.jiqizhixin.com/project/deepseek-v2
🤖 Agent开发
①项目:CodeFuse-muAgent
★CodeFuse-muAgent 是一个由知识图谱引擎驱动的创新代理框架,结合了多代理、函数调用、代码解释器等技术。通过画布拖拽和简单的文本编写,大语言模型可以在人工指导下执行各种复杂的标准操作程序。该框架已在蚂蚁集团的多个复杂DevOps场景中得到验证。
☆一键收藏:
https://sota.jiqizhixin.com/project/codefuse-muagent
🛠️框架平台、必备工具
①项目:Anything-LLM
★AnythingLLM 是一个全栈应用程序,允许用户将任何文档、资源或内容转化为上下文,以便在聊天时供任何大型语言模型(LLM)使用。该应用程序支持选择和使用不同的 LLM 或向量数据库,并支持多用户管理和权限设置。用户可以在本地运行或远程托管,智能地与提供的任何文档进行对话。
☆一键收藏:
https://sota.jiqizhixin.com/project/anythingllm
②项目名称:Flux Gym
★Flux Gym 是一个简单的 Web UI,用于在低显存(12GB/16GB/20GB)环境下训练 FLUX LoRA。前端基于 AI-Toolkit 的 Gradio UI,后端由 Kohya Scripts 提供支持。该项目旨在结合 AI-Toolkit WebUI 的简便性和 Kohya Scripts 的灵活性,提供一个易于使用且可扩展的 LoRA 训练界面。
☆一键收藏:
https://sota.jiqizhixin.com/project/fluxgym
③项目名称:KubeAI
★KubeAI 是一个在 Kubernetes 上运行的私有化 OpenAI 替代方案。它支持多种开源模型(如 LLMs、Whisper 等),并提供与 OpenAI 兼容的 API。KubeAI 具有多平台支持(CPU、GPU),并能根据负载自动扩展。项目还包含一个聊天界面(OpenWebUI)和消息集成功能(如 Kafka、PubSub)。
☆一键收藏:
https://sota.jiqizhixin.com/project/kubeai
④项目名称:Tomato
★Tomato 是一个概念验证的隐写术工具,利用最小熵耦合(MEC)技术将加密消息隐藏在自然语言中。该项目通过将隐藏消息的概率分布与LLM生成的覆盖文本的分布相结合,确保嵌入的消息在统计上与自然语言文本一致,从而使隐藏消息难以被检测到。
☆一键收藏:
https://sota.jiqizhixin.com/project/tomato
👋网页端访问:https://sota.jiqizhixin.com