MiniMax强势来袭
什么是线性注意力机制?
MiniMax-01 系列模型介绍
采用 80 层网络架构 64 个注意力头,每个头维度为 128 32 个专家模型组成的 MoE 系统 支持高达 400 万 token 的推理上下文长度 词表大小达 200,064
技术解读
性能评估
学术基准测试
长上下文处理能力
模型下载
OpenCSG社区:
https://opencsg.com/models/AIWizards/MiniMax-Text-01
https://opencsg.com/models/AIWizards/MiniMax-VL-01
欢迎加入OpenCSG社区
•贡献代码,与我们一同共建更好的OpenCSG
•Github主页
欢迎🌟:https://github.com/OpenCSGs
•Huggingface主页
欢迎下载:https://huggingface.co/opencsg
•加入我们的用户交流群,分享经验
扫描上方二维码添加小助手
“ 关于OpenCSG