重磅突破!ZipNN 可将模型大小压缩50%!

旅行   2024-11-29 00:14   北京  

AI模型压缩迎来革命性突破!

随着AI模型规模的爆炸性增长,基础设施的压力与日俱增。

仅Mistral一个模型每月就需要从Hugging Face下载40 PetaBytes的数据,传统压缩方法已经难以应对这一挑战。

在这一背景下,研究人员提出了ZipNN这一开创性的无损压缩方案,能够将AI模型体积压缩33%-50%,同时不丢失任何信息

压缩的秘密武器

ZipNN的核心创新在于指数位的分离压缩

研究发现,模型参数的指数位呈现高度倾斜的分布:

  • 模型参数通常在[-1,+1]范围内

  • 256个可能的指数值中,实际只有约40个被使用

  • 前12个指数值就占据了99.9%的参数

研究团队采用霍夫曼编码替代传统的Lempel-Ziv算法,不仅提高了压缩率,还显著加快了压缩速度。

惊人的压缩效果

ZipNN的压缩效果令人瞩目:

  • BF16模型可节省33%空间

  • 「干净」模型可压缩至原体积的45%

  • 比Zstd压缩算法提高17%的压缩率

  • 压缩和解压速度提升62%

这意味着模型中心每月可节省超过1 ExaByte的网络流量

技术原理揭秘

ZipNN的关键在于精准分离指数位

通过将指数数据与符号位和小数位分离,避免了相互干扰,实现了更高效的压缩。

研究论文《ZipNN: Lossless Compression for AI Models》已在arXiv上发布,为AI模型压缩开辟了全新的路径。

https://arxiv.org/abs/2411.05239

那么问题来了,如果阿里的ModelScope 或是HuggingFace 用上了ZipNN,一个月能省多少带宽费用?

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容,并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

  • 每天约监控6000 条消息,可节省约800+ 小时的阅读成本;

  • 每天挖掘出10+ 热门的/新的 github 开源 AI 项目;

  • 每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年,0.27元/天。(每+100人,+20元。元老福利~)

  • 一是运行有成本,我希望它能自我闭环,这样才能长期稳定运转;

  • 二是对人的挑选,鱼龙混杂不是我想要的,希望找到关注和热爱 AI 的人。

欢迎你的加入!

AGI Hunt
关注AGI 的沿途风景!
 最新文章