🏆基座模型
①项目:Nemotron-70B
★Llama-3.1-Nemotron-70B-Instruct 是由 NVIDIA 定制的大型语言模型,旨在提高 LLM 生成的用户查询响应的有效性。该模型在多个自动对齐基准测试中表现优异,超越了如 GPT-4o 和 Claude 3.5 Sonnet 等强大模型。它通过 RLHF(特别是 REINFORCE)进行训练,并支持 HuggingFace Transformers 代码库。
☆一键收藏:
https://sota.jiqizhixin.com/project/llama-3-1-nemotron
②项目:Mini-Omni2
★Mini-Omni2 是一个全方位交互模型,能够理解图像、音频和文本输入,并与用户进行端到端的语音对话。该项目具备实时语音输出、多模态理解和灵活的交互能力,支持在讲话时的中断机制。
☆一键收藏:
https://sota.jiqizhixin.com/project/mini-omni2
③项目:Ichigo
★Ichigo是一个开放的、持续进行的研究实验,旨在扩展基于文本的语言模型,使其具备原生的“聆听”能力。该项目采用了一种受Meta的Chameleon论文启发的早期融合技术,目标是打造一个类似于设备端Siri的开放数据、开放权重的语音助手。Ichigo通过在公共平台上进行训练,逐步提升其多轮对话能力,并能够拒绝处理不可听的查询。
☆一键收藏:
https://sota.jiqizhixin.com/project/ichigo
④项目:Toy Box Flux
★Toy Box Flux 是一个基于 AI 生成图像训练的项目,旨在通过结合现有的 3D LoRA 和 Coloring Book Flux LoRA 来创建独特风格的玩具设计。该项目专注于生成可爱的 3D 玩具渲染图像,适用于对象和人类主题。项目计划在未来版本中通过更多生成输出的训练来增强风格的一致性。
☆一键收藏:
https://sota.jiqizhixin.com/project/toy-box-flux
🛠️必备工具
①项目:Awesome o1
★Awesome o1 是一个与 OpenAI 的 o1 项目相关的论文集,收录了多篇在机器学习和自然语言处理领域的研究论文。这些论文探讨了从数学问题求解到语言模型推理等多个主题,展示了在这些领域的最新研究进展和技术应用。
☆一键收藏:
https://sota.jiqizhixin.com/project/awesome-o1
②项目:Tabled
★Tabled是一个小型库,用于检测和提取表格。它使用Surya在PDF中查找所有表格,识别行和列,并将单元格格式化为Markdown、CSV或HTML。该项目旨在简化从文档中提取表格数据的过程,支持多种文档格式,包括PDF、图像、Word文档和PowerPoint。
☆一键收藏: