量化压缩80%！160GB就能运行671B的DeepSeek R1

旅行 2025-01-28 12:15 中国香港

671B参数的DeepSeek 终于能在家里跑了！

@UnslothAI 刚刚放出重磅消息：他们成功将DeepSeek R1从720GB压缩到131GB，压缩率高达80%！

这意味着你只需要160GB显存就能运行这个参数量远超GPT-4媲美o1 的超大模型。

而且，这不是简单的压缩。

UnslothAI团队通过深入研究DeepSeek R1的架构，发现了一条独特的技术路径：

前3层是全连接层，仅占总权重的0.5%，保持4位或6位精度
共享专家的MoE层占1.5%，使用6位精度
MLA注意力模块占比不到5%，使用4位或6位精度
down_proj（尤其是前几层）对量化最敏感，需要更高精度
88%的权重来自MoE层，可以安全压缩到1.58位！

Dobby the Builder (@the100kprompts) 对此评价：

这是压缩的魔法秀！131GB运行671B参数模型是游戏规则的改变者。Dobby记得以前优化全靠硬件，现在智能软件才是关键。

那么，这个压缩版本表现如何？

在多个基准测试中，DeepSeek R1展现了惊人的性能：

AIME 2024数学测试：79.8%（超过GPT-4的9.3%）
MATH-500：97.3%（超过GPT-4的74.6%）
LiveCodeBench编程测试：**65.9%**的通过率
Codeforces编程评级达到2029分

UnslothAI提供了四个版本供选择：

量化位数	模型大小	性能表现	建议使用场景
1.58位	131GB	基础可用	资源受限场景
1.73位	158GB	良好	平衡性能与资源
2.22位	183GB	更佳	追求稳定性能
2.51位	212GB	最佳	性能优先场景

那如何在本地运行呢？

这里有完整的部署指南：

# 首先安装必要组件apt-get updateapt-get install build-essential cmake curl libcurl4-openssl-dev -ygit clone https://github.com/ggerganov/llama.cppcmake llama.cpp -B llama.cpp/build \    -DBUILD_SHARED_LIBS=OFF -DGGML_CUDA=ON -DLLAMA_CURL=ONcmake --build llama.cpp/build --config Release -j --clean-first --target llama-quantize llama-cli

然后就可以运行模型了：

./llama.cpp/llama-cli \    --model DeepSeek-R1-UD-IQ1_S/DeepSeek-R1-UD-IQ1_S-00001-of-00003.gguf \    --cache-type-k q4_0 \    --threads 12 -no-cnv --n-gpu-layers 7 \    --temp 0.6 \    --ctx-size 8192

使用建议：

温度参数设置在0.5-0.7之间（推荐0.6）
避免使用系统提示词，将指令直接放在用户提示中
对于数学问题，建议在提示词中加入「请一步步推理，并将最终答案放在\boxed{}中」
评估性能时建议多次测试取平均值

这也提示了一种新的量化压缩思路：通过深入理解模型架构，实现精准化压缩。

有卡的小伙伴，快去试试这个「轻量版」的AI巨兽吧！

相关链接：

博客详情：https://unsloth.ai/blog/deepseekr1-dynamic
模型下载：https://huggingface.co/unsloth/DeepSeek-R1-GGUF
官方论文：https://arxiv.org/abs/2404.11534
GitHub仓库：https://github.com/unslothai/llama.cpp

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

AGI Hunt

关注AGI 的沿途风景！

最新文章

从DeepSeek R1看推理模型的四种进化路线

对DeepSeek的五大误解！

重磅！Gemini 2.0全家桶发布：Flash免费用，Pro会写代码，还有一个便宜货

传言称Grok-3延迟！但马斯克仍手握最强算力

Deep Research 开源版来了！立省200美元

魔幻现实之：美国人下载DeepSeek 将坐牢20年？！

爆料：Anthropic 有比o3 更强的模型，但不敢放出来

华为突围：910C芯片性能达H100的60%！DeepSeek 已验证

OpenAI Deep Research上线：人类研究员失业倒计时？

基于o3-mini 的浏览器agent，打造属于自己的Operator

伯克利教授：AI思考的越多，越容易出错

o3-mini 的10 大疯狂应用案例！

指责DeepSeek 的OpenAI 们才是真正的賊！

特斯拉：This robot sucks!

Yann LeCun 痛批硅谷精英的优越感！

o3-mini 发布，但仍未走出DeepSeek 阴影

美分析机构称DeepSeek V3 成本远超600 万美元，实际达13亿美元！

OpenAI 最强模型o3 今晚发布！

重现Deepseek R1 「Aha Moment」的完整教程来了！

当马斯克的脑机接口卷到了书法界，我们正在见证史上最硬核的意念书法大赛！

Stable Diffusion 创始人：DeepSeek 没有抄袭！

Anthropic CEO：DeepSeek 为落后的追随者，需进一步加强中国芯片管制！

OpenAI 称有证据证明DeepSeek违规使用其模型！

Grok 重磅推出推理能力，Grok 3 或指日可待！

DeepSeek严正声明：警惕虚假账号冒充！

手把手教学：40000 元在家跑顶级DeepSeek R1的完整方案！

重磅！OpenAI 推出美国政府专用版ChatGPT Gov！

Meta 或成开源竞赛中最大输家！

DeepSeek 入场，Meta 或成开源竞赛中最大输家！

终于，Sam Altman 正面迎战DeepSeek！

量化压缩80%！160GB就能运行671B的DeepSeek R1

炸裂！DeepSeek 的新春礼物——多模态模型Janus-Pro 详解

DeepSeek 爆火遭Scale AI 华裔 CEO Alexandr Wang 痛批：美国必须加强对中国AI 管制！

继Operator 之后，Perplexity 推出多模态助手！

马斯克：OpenAI 星门计划将流产！

DeepSeek R1 6百万美元训练成本是否真实？

试用完 OpenAI 的新代理工具，以下是我们的发现

哈佛医学院：AI 将治愈癌症，Sam Altman 没在吹牛！

重磅！字节发布UI-TARS大模型，三句话搞定电脑操作！碾压GPT-4！

Perplexity发布Sonar API，提供实时信息搜索功能，一举超越所有搜索引擎和LLM！

Perplexity发布Sonar API，一举超越所有搜索引擎和LLM

重磅！OpenAI 宣布5000亿美元启动Stargate项目，「星门计划」再起波澜！

Anthropic发布 Agent 最佳实践指南！

重磅！Anthropic CEO 称将于2025年推出数字员工！

Perplexity CEO：印度应向中国学习模型研发！

DeepSeek R1 训练方法解析

超便携AI超算来了！这台「公文包」竟能塞下一台超级计算机

以小博大，DeepSeek-R1-Distill-Qwen-1.5B 开源模型击败GPT-4和Claude 3.5!

爬虫工程师将失业！Firecrawl 能让你一句话抓取全网数据！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉