清华、智谱团队提出“预训练蒸馏” Hugging Face 提出开源、无代码工具/库 AutoTrain Pangea:横跨 39 种语言的完全开放多语言多模态大语言模型 具有世界模型的网络智能体:在网络导航中学习和利用环境动态 Mini-Omni2:具有视觉、语音和双工功能的“开源 GPT-4o” 微软提出新型注意力机制 SeerAttention MIT 团队:利用混合自回归 Transformer 实现高效视觉生成 字节团队推出多模态扩散蛋白质语言模型 DPLM-2 语言模型可以通过“自省”了解自己 劝说平衡训练:保护大模型不受劝说影响的第一步
想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看“2024必读大模型论文” ps:我们日常会分享日报、周报,后续每月也会出一期月报,敬请期待~