🏆基座模型
①项目:Granite 3.0
★该系列模型最大亮点在于低延迟、支持基于工具的使用场景、检索增强生成技术以及在小型设备上对 MoE 混合模型的支持。该模型通过两阶段训练策略从头开始训练,第一阶段使用来自不同领域的10万亿个token进行训练,第二阶段则使用精心策划的高质量数据进行训练,以提高特定任务的性能。支持多种语言,并可用于文本摘要、分类、提取、问答等任务。
☆一键收藏:
https://sota.jiqizhixin.com/project/granite-3-0
②项目:Allegro
★Allegro是一个强大的文本生成视频模型,可以从简单的文本输入生成高质量的视频。该模型支持生成最长6秒的视频,帧率为15 FPS,分辨率为720p。Allegro利用先进的机器学习技术,旨在为用户提供便捷的文本到视频转换体验。
☆一键收藏:
https://sota.jiqizhixin.com/project/allegro
🛠️框架平台、必备工具
①项目:Whisper Turbo MLX
★Whisper Turbo MLX 是一个快速且轻量级的语音识别项目,基于Whisper模型的MLX实现。该项目旨在提供高效的音频转录功能,所有代码都封装在一个不到300行的文件中,适用于需要快速处理大量音频数据的场景。
☆一键收藏:
https://sota.jiqizhixin.com/project/whisper-turbo-mlx
②项目:BaseAI
★BaseAI是一个用于构建声明式和可组合的AI驱动LLM产品的框架。它允许用户在本地机器上开发AI代理管道,并集成了代理工具和记忆功能(RAG)。BaseAI旨在简化AI产品的开发过程,提供全面的文档和学习指南。
☆一键收藏:
https://sota.jiqizhixin.com/project/baseai
③项目:rag-chatbot
★该项目允许用户在本地与多个PDF文件进行交互式聊天。它支持使用来自Huggingface和Ollama的模型,并计划支持多语言聊天。项目提供了一个简单的用户界面,通过Gradio实现,用户可以在本地或Kaggle上轻松运行。
☆一键收藏:
https://sota.jiqizhixin.com/project/rag-chatbot
🤖 Agent开发
①项目:LangGraph ReAct Memory Agent
★Memory Agent是一个基于ReAct风格的智能体示例,旨在通过工具保存记忆。这种方法允许智能体在对话线程中持久化重要信息,并根据用户ID配置记忆范围,从而让机器人学习用户的偏好。
☆一键收藏: