今日开源(2024-11-08):HelloMeme图像生成模型插件,超真实多图片之间的表情迁移,兼容多种模型

文摘   2024-11-08 18:30   北京  


🛠️框架平台、必备工具

①项目:HelloMeme

HelloMeme项目通过集成空间编织注意力机制,将高层次和高保真条件嵌入扩散模型中。该项目提供了图像和视频生成的功能,支持用户通过参考图像和驱动图像/视频生成新的内容。

☆一键收藏:

https://sota.jiqizhixin.com/project/hellomeme

②项目:Cosmos Tokenizer

Cosmos Tokenizer 是一套用于图像和视频的神经Tokenizer,旨在推进视觉token的技术前沿。该项目支持大规模、稳健和高效的自动回归transformer(如大型语言模型)或扩散生成器的开发。项目提供了不同tokenizer的推理代码和预训练模型,能够实现高达2048倍的总压缩率,同时保持较高的图像质量,并比现有的最先进方法快12倍。

☆一键收藏:

https://sota.jiqizhixin.com/project/cosmos-tokenizer


③项目:Regional-Prompting-FLUX

Regional-Prompting-FLUX 是一种无需训练的区域提示方法,专为 Diffusion Transformers(即 FLUX)设计,能够实现细粒度的文本到图像生成。该方法在不需要额外训练的情况下,提供了与 LoRA 和 ControlNet 的高度兼容性。相比基于 RPG 的实现,Regional-Prompting-FLUX 推理速度更快且占用更少的 GPU 内存。

☆一键收藏:

https://sota.jiqizhixin.com/project/regional-prompting-flux


④项目:InkSight

InkSight项目旨在通过学习阅读和书写,将离线手写内容转换为在线格式。该项目利用先进的机器学习和深度学习技术,提供了一种高效的手写识别解决方案。其核心在于将传统的手写输入转化为可编辑的数字文本,适用于多种应用场景,如文档数字化和手写笔记转换。

☆一键收藏:

https://sota.jiqizhixin.com/project/inksight


⑤项目:Aide code editor

Aide是一个开源的AI原生代码编辑器,是VS Code的一个分支。它与领先的代理框架swebench-lite紧密集成,结合了VS Code的强大功能和先进的AI能力,旨在成为开发者的智能编码助手,帮助用户更快地编写更好的代码,同时保持对开发过程的完全控制。

☆一键收藏:

https://sota.jiqizhixin.com/project/aide-code-editor


🏆基座模型

①项目:OS-ATLAS

★OS-ATLAS是一个为通用GUI智能体设计的基础动作模型。该项目提供了两个基础的定位模型:OS-Atlas-Base-4B和OS-Atlas-Base-7B,分别从InternVL2-4B和Qwen2-VL-7B-Instruct微调而来。模型能够接受任意大小的图像输入,并输出相对坐标,用于图像的中心点或边界框的定位。

☆一键收藏:

https://sota.jiqizhixin.com/project/os-atlas


今日可用大模型,免费 API 调用

11月08日更新

① 多模态

  • Qwen2-VL-2B-Instruct

  • InternVL2-1B

  • InternVL2-2B

  • InternVL2-4B

② 中文大模型

  • Llama3.1-8B-Chinese-Chat

  • Qwen2-7B-Instruct

  • Mistral-7B-Instruct-v0.3

  • Meta-Llama-3.1-8B-Instruct

③ 其他

  • Llama-3.2-1B-Instruct

  • Llama-3.2-3B-Instruct

  • Janus-1.3B(deepseek)


-------------   详细内容  -------------

① 多模态

Qwen2-VL-2B-Instruct

清湛/湖州4090 公共线路 | 推理用时~10s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/Qwen2-VL-2B-Instruct_476914df95/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/841ce671-abf3-425c-abae-25a3ebf7ae87


InternVL2-1B

清湛/湖州4090 公共线路;推理用时~19s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/InternVL2-1B_ba0e4230fd/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/639608ab-8f04-484f-8f02-be15e041ffc4


InternVL2-2B

清湛/湖州4090 公共线路;推理用时~5s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/InternVL2-2B_d879ed7c5e/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/4658dbdb-f562-46bb-976d-632576a457fa


InternVL2-4B

清湛/湖州4090 公共线路;推理用时~20s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/InternVL2-4B_b354ea016a/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/12e21494-623f-4fc5-8e8b-53bfe8244e11


② 中文

Llama3.1-8B-Chinese-Chat

清湛/呼和浩特A40 公共线路;推理用时~25s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/Llama3_1-8B-Chinese-Chat_be6a7351a9/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/09daa9b1-600d-47ea-96f1-a0de627f2276


Qwen2-7B-Instruct

清湛/呼和浩特A40 公共线路;推理用时~4s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/qwen2-7b-instruct_961a4c2658/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/c567753a-cb24-4fda-8aac-fe1e2f437db1


Mistral-7B-Instruct-v0.3

清湛/呼和浩特A40 公共线路;推理用时~5s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/Mistral-7B-Instruct-v0_3_d55a1b3441/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/4f45a6c3-01b3-4907-8836-0a90e62899ea


Meta-Llama-3.1-8B-Instruct

清湛/呼和浩特A40 公共线路;推理用时~5s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/Meta-Llama-3_1-8B-Instruct_058eda30f1/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/faf646bc-bf73-4fed-93fd-fc8d4e5e6d4a


③ 其他

Llama-3.2-1B-Instruct

清湛/湖州4090 公共线路;推理用时~12s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/Llama-3_2-1B-Instruct_04ba370ac5/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/bfc4890c-0b41-4050-ab78-bc4136162bb9


Llama-3.2-3B-Instruct

清湛/湖州4090 公共线路;推理用时~10s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/Llama-3_2-3B-Instruct_26537cad08/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/d476dbe2-92b9-4f88-8c2d-be10542c83ae


Janus-1.3B(deepseek)

清湛/湖州4090 公共线路;推理用时~15s | 倒计时2天

API调用地址:

https://sota.jiqizhixin.com/model-api/Janus-1_3B_22407fe3ad/chat/completions

获取秘钥:

https://sota.jiqizhixin.com/xt-terminal/10a5d42d-7300-48cd-8dff-79b60d109a91


📋 查看API调用文档:

https://jiqizhixin.feishu.cn/wiki/EfHwwEuXZimdgpkQLXLcrOwKnyb 

💻 试用更多模型API :

 https://sota.jiqizhixin.com/xt-terminal




机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章