MambaInLlama:大型Transformer模型蒸馏与加速的混合模型工具,致力于在保持生成质量的同时,减少资源消耗并提高效率,适用于基础模型和聊天模型的优化。
参考文献:
[1] https://github.com/jxiw/MambaInLlama
[2] https://arxiv.org/abs/2408.15237
欢迎大家支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。如果微信群二维码过期,可加个人微信(buxingtianxia21)进群。
NLP工程化知识星球
NLP工程化分享群