AI Safeguard联合卡内基梅隆和斯坦福最新开源的一款轻量级的多模态模型:Ivy-VL

科技   2024-12-15 00:00   浙江  

AI Safeguard联合卡内基梅隆和斯坦福最新开源的一款轻量级的多模态模型:Ivy-VL。3B参数,在多个基准测试中超过了PaliGemma 3B 、 Moondream2 、 Qwen2-VL-2B 、 InternVL2-2B和InternVL2_5-2B等。支持图像文本输入,文本输出,可以用于各种视觉问答和图像理解任务,可以用于部署在,比如AI眼镜、智能手机等设备上。

参考文献:
[1] 模型:https://huggingface.co/AI-Safeguard/Ivy-VL-llava
[2] https://colab.research.google.com/drive/1D5_8sDRcP1HKlWtlqTH7s64xG8OH9NH0



欢迎大家支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。如果微信群二维码过期,可加个人微信(buxingtianxia21)进群。

NLP工程化知识星球

NLP工程化分享群

NLP工程化
专注于对话系统领域的技术分享,重点写《Dify应用操作和源码剖析》专栏。
 最新文章