今日开源(2024-10-12):上交发布libcom图像合成全能工具箱,全方位覆盖十余项功能,轻松实现前景与背景的完美融合!

文摘   2024-10-12 18:14   北京  


🛠️必备工具

①项目:libcom

libcom是一个图像合成工具箱,旨在通过解决前景和背景之间的外观、几何和语义不一致性,将一个前景插入到背景图像中以获得逼真的合成图像。libcom涵盖了图像合成领域的多种相关任务,包括图像混合、标准/画风图像和谐、阴影生成、对象放置、生成式合成、质量评估等。每个任务中,libcom集成了一到两种考虑效率和效果的方法,并会随着更好方法的出现不断更新。

☆一键收藏:

https://sota.jiqizhixin.com/project/libcom


②项目:MLE-Bench

MLE-bench是一个用于评估AI智能体在机器学习工程中表现的基准测试工具。该项目提供了一套完整的工具和数据集,用于测试和评估AI系统在处理机器学习任务时的能力。通过使用75个Kaggle竞赛的数据集,MLE-bench能够对AI智能体的工程能力进行全面的评估。

☆一键收藏:

https://sota.jiqizhixin.com/project/mle-bench


项目:LLM Evaluation guidebook

LLM Evaluation Guidebook 是一本关于如何评估大型语言模型(LLM)的指南。它提供了多种评估模型的方法,指导用户设计自己的评估,并分享了实践经验中的技巧和窍门。无论是生产模型的开发者、研究人员还是爱好者,都可以从中找到所需的信息。

☆一键收藏:

https://sota.jiqizhixin.com/project/llm-evaluation-guidebook


④项目:lm.rs

lm.rs 是一个用 Rust 编写的最小化语言模型推理项目,支持在 CPU 上本地运行。项目灵感来源于 Karpathy 的 llama2.c 和 llm.c,旨在无需机器学习库的情况下进行完整的语言模型推理。当前支持多模态的 PHI-3.5-vision 模型和文本专用的 PHI-3.5-mini 模型。项目还支持 Llama 3.2 和 Gemma 2 模型,并提供量化模型以优化性能。

☆一键收藏:

https://sota.jiqizhixin.com/project/lm-rs


⑤项目:CogVideoX Factory

CogVideoX Factory 是一个用于视频生成模型 CogVideoX 的内存优化微调脚本库。该项目利用 TorchAO 和 DeepSpeed 技术,支持在 24GB GPU 内存下进行视频模型的微调。用户可以通过该项目实现文本到视频、图像到视频的生成任务,并提供了多种微调和训练脚本以适应不同的生成需求。

☆一键收藏:

https://sota.jiqizhixin.com/project/cogvideox-factory


🤖 Agent开发

①项目:Swarm

Swarm是一个由OpenAI Solutions团队管理的实验性框架,旨在构建、协调和部署多智能体系统。该框架通过代理和交接的原语抽象,实现了轻量级、高度可控和易于测试的agent协调和执行。Swarm主要用于展示在“Orchestrating Agents: Handoffs & Routines”中探索的交接和例程模式,适合需要处理大量独立功能和指令的场景。

☆一键收藏:

https://sota.jiqizhixin.com/project/swarm



机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章