今日开源(2024-10-22):IBM开源Granite 3.0企业级AI,2B/8B等版本,超12万亿个训练数据token

文摘   2024-10-22 18:17   北京  


🏆基座模型

①项目:Granite 3.0

该系列模型最大亮点在于低延迟、支持基于工具的使用场景、检索增强生成技术以及在小型设备上对 MoE 混合模型的支持。该模型通过两阶段训练策略从头开始训练,第一阶段使用来自不同领域的10万亿个token进行训练,第二阶段则使用精心策划的高质量数据进行训练,以提高特定任务的性能。支持多种语言,并可用于文本摘要、分类、提取、问答等任务。

☆一键收藏:

https://sota.jiqizhixin.com/project/granite-3-0


②项目:Allegro

Allegro是一个强大的文本生成视频模型,可以从简单的文本输入生成高质量的视频。该模型支持生成最长6秒的视频,帧率为15 FPS,分辨率为720p。Allegro利用先进的机器学习技术,旨在为用户提供便捷的文本到视频转换体验。

☆一键收藏:

https://sota.jiqizhixin.com/project/allegro


🛠️框架平台、必备工具

①项目:Whisper Turbo MLX

Whisper Turbo MLX 是一个快速且轻量级的语音识别项目,基于Whisper模型的MLX实现。该项目旨在提供高效的音频转录功能,所有代码都封装在一个不到300行的文件中,适用于需要快速处理大量音频数据的场景。

☆一键收藏:

https://sota.jiqizhixin.com/project/whisper-turbo-mlx


②项目:BaseAI

BaseAI是一个用于构建声明式和可组合的AI驱动LLM产品的框架。它允许用户在本地机器上开发AI代理管道,并集成了代理工具和记忆功能(RAG)。BaseAI旨在简化AI产品的开发过程,提供全面的文档和学习指南。

☆一键收藏:

https://sota.jiqizhixin.com/project/baseai


③项目:rag-chatbot

该项目允许用户在本地与多个PDF文件进行交互式聊天。它支持使用来自Huggingface和Ollama的模型,并计划支持多语言聊天。项目提供了一个简单的用户界面,通过Gradio实现,用户可以在本地或Kaggle上轻松运行。

☆一键收藏:

https://sota.jiqizhixin.com/project/rag-chatbot


🤖 Agent开发

①项目:LangGraph ReAct Memory Agent

Memory Agent是一个基于ReAct风格的智能体示例,旨在通过工具保存记忆。这种方法允许智能体在对话线程中持久化重要信息,并根据用户ID配置记忆范围,从而让机器人学习用户的偏好。

☆一键收藏:

https://sota.jiqizhixin.com/project/langgraph-react-memory-agent



机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章