微软发布bitnet.cpp:一个高效1-bit LLMs语言模型推理框架

文摘   2024-11-02 07:45   福建  

Microsoft推出了bitnet.cpp,这是专为1-bit大型语言模型(如BitNet b1.58)设计的推理框架。该框架在ARM CPU上实现了1.37倍至5.07倍的速度提升,并降低了55.4%至70.0%的能耗;在x86 CPU上,速度提升范围为2.37倍到6.17倍,能耗降低71.9%至82.2%。bitnet.cpp使得在单个CPU上运行100B位的模型成为可能,推理速度可与人类阅读速度相媲美。


参考:

  1. https://github.com/microsoft/BitNet



点个享、点赞在看,你最好看~


Halo咯咯
专注于技术知识整理,包含人工智能、大模型、机器学习、深度学习、大数据等多个领域的技术知识,以及各种开源的内容~
 最新文章