Nexa AI推出了OmniAudio-2.6B,这是一款专为边缘部署设计的音频语言模型,集成了Gemma-2-2b、Whisper Turbo和自定义投影器,旨在提高音频处理的速度和效率。该模型在2024 Mac Mini M4 Pro上能够达到每秒66个标记的处理速度,显著超过其他竞争产品,且其紧凑设计使其非常适合在可穿戴设备、汽车系统和物联网设备中应用。OmniAudio-2.6B的高准确性和灵活性使其在转录、翻译和摘要等任务中表现出色,满足了对实时音频应用的需求。
参考:
https://huggingface.co/NexaAIDev/OmniAudio-2.6B https://nexa.ai/blogs/omniaudio-2.6b
点个分享、点赞与在看,你最好看~