DeepSeek-AI推出了DeepSeek-VL2系列,这是新一代开源混合专家(MoE)视觉语言模型,采用动态切片和多头潜在注意力机制等先进技术。该系列包括三种配置:DeepSeek-VL2-Tiny(33.7亿参数)、DeepSeek-VL2-Small(161亿参数)和DeepSeek-VL2(275亿参数),能够在不同的应用需求和计算预算下灵活适应。DeepSeek-VL2在光学字符识别(OCR)和视觉定位等任务中表现出色,显著提高了准确性,并在计算资源使用上比同类模型减少了30%。
参考:
https://huggingface.co/collections/deepseek-ai/deepseek-vl2-675c22accc456d3beb4613ab
点个分享、点赞与在看,你最好看~