首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

“CloseAI”在美国，“OpenAI”在中国

科技 2025-01-22 11:23 中国香港

大家好，我是章北海

今天中国版 OpenAI——DeepSeek 开源了最新、最强悍 R1 系列大模型

DeepSeek-R1 推理大模型
DeepSeek-R1-Zero
R1 数据蒸馏的 Qwen、Llama 系列小模型

DeepSeek-R1 推理大模型，性能与 OpenAI-o1-1217 不相上下。

最惊艳的是 R1-Zero 模型（预训练模型直接 RL，不走 SFT）在思考过程中涌现了“顿悟时刻”（aha moment），并自己学会为问题分配更多思考时间。

DeepSeek 团队开源了蒸馏的 Qwen 和 Llama 系列模型，蒸馏 14B 模型在推理基准测试中大幅超过了当前最先进的开源 QwQ-32B-Preview，而蒸馏的 32B 和 70B 模型在密集模型中树立了新的推理任务基准。

团队还把在实验过程中很多失败的尝试分享出来，防止后人踩坑。在过程奖励模型、蒙特卡洛树搜索算法上，DeepSeek 都没能获得进展。不过他们也强调，只是他们失败了，并不意味着这些方法无法开发出有效的推理模型。

也就是，过程奖励模型、蒙特卡洛树搜索算法可能此路不通，但也可能是我们不行。

运行 deepseek-r1

现在 ollama 一行代码

ollama run deepseek-r1:7b 即可跑起deepseek-r1

70 亿参数版本的本地运行，我测了一下

模型大小 4.7GB

运行起来之后，显存占用只有5.4GB

实际对话，最明显的变化是可以看到它的思考过程

更大尺寸的版本，我还在下载中，如果感受不错，我可能要抛弃Qwen2.5了。

这一波开源，我看很多评论把 DeepSeek 成为真正的 OpenAI，仅看开源协议就属实真诚了

🏆 DeepSeek-R1 采用 MIT 许可证，免费商用 🔓 向社区开放，以便利用模型权重和输出 🛠️ API 输出可用于微调与蒸馏

❝
MIT 许可证是源自美国麻省理工学院（Massachusetts Institute of Technology，MIT）的一种开源许可证。MIT 许可证是一种非常宽松的开源许可证，对软件的使用、修改和分发限制较少，给予了开发者极大的自由。

最后放一些列deepseek相关资源，共同学习：

网页体验：https://chat.deepseek.com/
ollama：https://ollama.com/library/deepseek-r1
API 手册：https://api-docs.deepseek.com/guides/reasoning_model
官方简介：https://x.com/deepseek_ai/status/1881318130334814301
基于 Gradio 的 deepseek-chatbot：https://github.com/AK391/ai-gradio
论文：https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

关注老章，一起站在科技与成华大道的十字路口

机器学习算法与Python实战

长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态，分享Python、机器学习等技术文章。回复机器学习有惊喜资料。

最新文章

奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek

DeepSeek突围奥秘曝光，天才集结，开出千万年薪

微软前脚调查DeepSeek，后脚火速上线

DeepSeek 更值得被关注的是R1-Zero，强化学习（RL）比人类专家标注的监督微调（SFT）更靠谱

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

DeepSeek引发硅谷恐慌：它正向西方AI巨头发起挑战

「神秘的东方力量」刷爆美国AI圈，李彦宏啪啪打脸

英伟达RTX 5090评测解禁，AI 能力太强了

2025泰晤士世界学科排名公布！北大第一、浙大第二

央国企！入局AI大模型（附66家名单）

吴恩达：中国的DeepSeek让人印象深刻，我想对他们说“加油”

狂发顶会的特征融合，再出神作！

“CloseAI”在美国，“OpenAI”在中国

请立即拿下软考证（政策风口）

大模型参加考研，第一名是 OpenAI 的 GPT-o1模型，第二名是是国产！

突发！电子科技大学被军方通报处罚

李飞飞最新访谈：AI Agent的根本定位应该是工具而非主导者，是赋能者而非替代者！

英伟达特供中国的5090D，被爆只能玩游戏，不能玩AI！！！

【民间】2024毕业生薪酬排行榜发布！还是清华最强

搭建完美的写作环境：Obsidian + Cloudflare R2 同步笔记

太强了，8 行代码，开发一个AI应用

CNN+LSTM+Attention多热点搭配！又是创新性拉满的高分思路！！

老婆饼里没有老婆，夫妻肺片里没有夫妻，RLHF 里也没有真正的 RL

AI服务器环境搭建指南，从裸机到“战斗”机（下集）

2024年AI大模型回顾！

AI又双叒叕来革命，程序员又双叒叕失业潮

AI服务器环境搭建指南，从裸机到“战斗”机（2）：防火墙、Git、Docker、Python、多用户JupyterHub

突发！美国拟（全面禁止）向中国出口 AI 芯片

AI服务器环境搭建指南，从裸机到“战斗”机（上集）

【附复现代码】基于PINN的论文创新思路

血亏，刚买了4090，更强悍、更便宜的5090来了

【机器学习数学基础系列】概率论中的极大似然估计：入门与Python实践

统计学中的假设检验：Python实现U检验和卡方检验

用大模型写了本书

本地运行大模型，要买什么显卡？

Python中级教程-测试开发

抑郁6个月后，DeepMind科学家离世，万字绝笔谈在AI行业工作压力

Python高级编程：web开发之Flask

Python 高级教程：异步与并发编程详解

真的建议赶紧搞个软考证书！（红利期）

ICML 2025，即将截稿！

Dify 零代码 AI 应用开发：内网离线部署指南

2025年了，居然还有人 Python 都没入门

2024年过去了，我很不怀念它

Docker 极简入门

2024年最常用的Python库和工具

OpenAI裂变成了两块：一块营利，一块非营利

国产大模型，火爆全球，6710亿参数，已开源！

横扫2024各大顶会，用Mamba发Paper真的很轻松！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉