Nexa AI 发布 OmniAudio-2.6B:用于边缘部署的快速音频语言模型

文摘   2025-01-05 08:45   福建  

Nexa AI推出了OmniAudio-2.6B,这是一款专为边缘部署设计的音频语言模型,集成了Gemma-2-2b、Whisper Turbo和自定义投影器,旨在提高音频处理的速度和效率。该模型在2024 Mac Mini M4 Pro上能够达到每秒66个标记的处理速度,显著超过其他竞争产品,且其紧凑设计使其非常适合在可穿戴设备、汽车系统和物联网设备中应用。OmniAudio-2.6B的高准确性和灵活性使其在转录、翻译和摘要等任务中表现出色,满足了对实时音频应用的需求。

参考:

  1. https://huggingface.co/NexaAIDev/OmniAudio-2.6B
  2. https://nexa.ai/blogs/omniaudio-2.6b



点个享、点赞在看,你最好看~


Halo咯咯
专注于技术知识整理,包含人工智能、大模型、机器学习、深度学习、大数据等多个领域的技术知识,以及各种开源的内容~
 最新文章