DeepSeek-VL2:DeepSeek的先进视觉语言模型,在多模态理解方面取得了显著进展,特别是在视觉问题回答、光学字符识别、文档 / 表格 / 图表理解和视觉定位等任务上表现出色。
参考文献:
[1] https://github.com/deepseek-ai/DeepSeek-VL2
欢迎大家支持我的知识星球(NLP工程化):Dify源码剖析及答疑,Dify对话系统源码,电子书籍报告下载,公众号所有付费资料。如果微信群二维码过期,可加个人微信(buxingtianxia21)进群。
NLP工程化知识星球
NLP工程化分享群