硬控。

科技   2025-01-27 13:02   山东  

2025 开年第一炸,DeepSeek-R1 开源了。多家海外主流媒体密集报道,这股“东方神秘力量”一夜爆红,正在「硬控」硅谷。

开源不到一周,DeepSeek-R1 就在 GitHub 上斩获得 22k 的 Star,恐怖如斯!
AI 科技初创公司 Scale AI 的创始人 Alexandr Wang 说,中国的人工智能公司 DeepSeek 所开发的 AI 大模型,其性能大致与美国顶尖模型相当。
尽管在过去十年中,美国可能在人工智能竞赛中一直领先于中国,但 DeepSeek 的 AI 大模型的发布可能会「彻底改变局面」。
图灵奖得主,深度学习三巨头之一“杨立昆”对 DeepSeek 的评价:这是开源的胜利。但这也让一直想用「开源」来争夺大模型王座的 Meta 感到危机感。

《黑神话·悟空》的制作人冯骥,也在昨天晚上发文,力荐 DeepSeek 。都是杭州的公司,真实惺惺相惜啊。

心资本合伙人也在即刻评论,为什么 DeepSeek 的模型做这么好?

01

Meta 慌了!

整个 2024 年,Meta 一直想用「开源」来争夺大模型王座,想做大模型界的 Linux,但是他们开始恐慌了。

Meta 的员工在一个匿名论坛上爆料,DeepSeek 的爆火让他们的 AI 团队感到恐慌。除了在排名上 Meta 开源的模型落后,更让他们震撼的是:DeepSeek V3 是中国一个不知名的公司,仅用 550 万美金训练费用搞出来的。

成本还没有他们部门一个领导的工资高,之前动辄几十亿美元的投入,让团队没办法向 Meta 高层交代。

目前 Meta 的员工正在疯狂的分析 DeepSeek 的代码,试图复制。因为 DeepSeek 没有任何监督训练,纯强化学习路线,这个技术路线着令人震撼。

02

开始复现!
不仅仅是 Meta,全球科技圈掀起了 DeepSeek 复现狂潮,HuggingFace 、伯克利、港科大等团队加入其中。
HuggingFace
HuggingFace 的 CEO 在 X 上宣布,要开源复现 DeepSeek-R1 模型过程中的所有内容,包括训练数据、脚本等。目前复现的开源项目 open-r1 已经获得了 3.5k 的 Star。

开源地址:https://github.com/huggingface/open-r1

港科大团队
港科大团队刚刚开源了 simpleRL-reason,这是 DeepSeek-R1-Zero 和 DeepSeek-R1 在数据有限的小模型上进行训练的复制品。

开源地址:https://github.com/hkust-nlp/simpleRL-reason

伯克利团队

开源地址:https://github.com/Jiayi-Pan/TinyZero

03

手把手教你部署
逛逛教你本地傻瓜式部署 DeepSeek 模型,可以使用 Ollama 这个本地部署和运行大模型的工具,来在你的电脑本地上运行 DeepSeek-R1 大模型。
① 官网搜索 Ollama ,然后下载对应你操作系统的版本。我拿 MacOS 举例。
② 安装后运行 Ollama,点击 install 即可
③ 去打开你的终端 terminal ,输入如下命令,就可以下载并部署大模型了

ollama run deepseek-r1:32b

上述 deepseek-r1:32b 是模型的尺寸和型号,你可以根据自己情况来选择合适的模型。

04

上牌桌,来打牌!
在 Arena 榜单上,DeepSeek-R1 得分甚至高于Open AI 的 o1模型!是前十榜单里唯一的来自中国大陆的开源模型。
从价格上,DeepSeek-R1 也展现了它出色的性价比:

逛逛之前一直以为中国在 AI 大模型的竞争优势在产品化和场景落地,但是 DeepSeek-R1 的出现,让中国上了全球 AI 大模型基础能力竞赛的牌桌。

05
关注我,和我聊天
这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接和逛逛 GitHub 对话聊天就行了:


逛逛GitHub
每天推荐一个好玩的 GitHub 开源项目,给我发消息获取各种项目。
 最新文章