DeepSeek-AI开源DeepSeek-VL2系列:3B、16B、27B三种模型,混合专家(MoE)架构重新定义视觉语言AI

文摘   2025-01-05 08:45   福建  

DeepSeek-AI推出了DeepSeek-VL2系列,这是新一代开源混合专家(MoE)视觉语言模型,采用动态切片和多头潜在注意力机制等先进技术。该系列包括三种配置:DeepSeek-VL2-Tiny(33.7亿参数)、DeepSeek-VL2-Small(161亿参数)和DeepSeek-VL2(275亿参数),能够在不同的应用需求和计算预算下灵活适应。DeepSeek-VL2在光学字符识别(OCR)和视觉定位等任务中表现出色,显著提高了准确性,并在计算资源使用上比同类模型减少了30%。

参考:

  1. https://huggingface.co/collections/deepseek-ai/deepseek-vl2-675c22accc456d3beb4613ab



点个享、点赞在看,你最好看~


Halo咯咯
专注于技术知识整理,包含人工智能、大模型、机器学习、深度学习、大数据等多个领域的技术知识,以及各种开源的内容~
 最新文章