LLMWare.ai 最近在 Hugging Face 上推出了 Model Depot,这是一个针对 Intel PC 的小型语言模型(SLM)的大型集合,包含超过 100 种模型,涵盖聊天、编码、数学、函数调用和嵌入等多种应用场景。该平台为开源 AI 社区提供了优化的 SLM,支持 Intel 的 OpenVINO 和 ONNX 格式,使开发者能够在本地硬件上高效创建检索增强生成(RAG)和基于代理的工作流。此外,研究显示,在 OpenVINO 格式下部署 4 位量化的小型语言模型可以显著提升推理性能,速度比传统方法快 7.6 倍。
参考:
https://github.com/llmware-ai/llmware
点个分享、点赞与在看,你最好看~