上海AI实验室OpenGVLab开源了其最新多模态模型,首个在MMMU基准中超过70%的开源LLM:InternVL 2.5,性能媲美GPT-4o、Claude-3.5-Sonnet。
1、有1B/2B/4B/8B/26B/38B/78B 七个型号,支持单图、多图、视频、文本多种输入
2、基于Intern-ViT编码器构建
3、采用链式思考推理,增强了解决复杂任务的能力
4、动态高分辨率处理策略,增强了图像处理能力
参考文献:
[1] github:https://github.com/OpenGVLab/InternVL
[2] 模型:https://huggingface.co/collections/OpenGVLab/internvl-25-673e1019b66e2218f68d7c1c
[3] Demo:https://internvl.opengvlab.com/
欢迎大家支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。如果微信群二维码过期,可加个人微信(buxingtianxia21)进群。
NLP工程化知识星球
NLP工程化分享群