首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

国产之光DeepSeek杀疯了

文摘 2025-01-28 19:27 浙江

欢迎点击下方👇🏻关注我，记得星标哟~

文末有惊喜~

大家好，我是汤师爷~

杀疯了，国产之光DeepSeek杀疯了。

这个来自东方的神秘力量，这两天还是持续发酵，它居然超过了ChatGPT登上了苹果应用商店的免费版榜首，对整个西方科技界的冲击非常大。

null

它用区区2000张GPU就训练出了比肩OpenAI的O1水平的大模型。那些花了几百亿美金买了GPU的微软、甲骨文等科技巨头都要哭晕在厕所。

百万人在推特上刷屏

短短几天，百万人在推特上刷屏，这真是国产AI首次能在全球迎来这样的局面，这次deepseek的发布绝对超出了所有人的预期，不仅推出了全新的开源大模型，还同步发布了R1 zero和小模型，每一个都在科技圈掀起巨大轰动。

许多业内人士甚至喊出了"DeepSeek将接班OpenAI"的口号。

比如，前Meta AI工作人员、知名AI论文推特作者Elvis就强调，DeepSeek-R1的论文堪称瑰宝，因为它不仅探索了多种提升大语言模型推理能力的方法，还发现了更明确的涌现特性。

null

最让人惊喜的是，R1不再依赖传统监督学习，凭借GRPO的模式强化学习不断自我进化，让AI自己突然学会了怎么思考。

GRPO的模式实际上很简单：它通过比较同组样本来计算策略梯度，既降低了训练的不稳定性，又提高了学习效率。

打个比方，就像老师出题，让模型对每道题给出多个答案。然后通过奖惩规则给这些答案打分，模型就会追求高分、避免低分，从而不断改进。

整个流程是：输入问题 → 模型生成多个答案 → 规则系统评分 → GRPO计算相对优势 → 更新模型

null

DeepSeek为何如此强大？

首先，性能方面，DeepSeek在数学、代码、自然语言推理等任务上，表现相当出色，完全可以和OpenAI的o1正式版媲美。

其次，价格方面，目前每百万输入token的价格是4元，如果命中缓存的话，价格还能降到1元。输出价格则是每百万token16元，这绝对是全网最低价。

而且，DeepSeek的代码仓库完全开源，使用的是最宽松的MIT 开源协议，不限制商用，无需申请。还允许用户通过模型蒸馏等方式训练其他模型，蒸馏出的小模型已经完全超越OpenAI o1-mini。

DeepSeek这波格局拉得太满了，这才是真正的开源AI。虽然DeepSeek的官网界面和功能现在还比较简陋，但开源才是未来，DeepSeek就是未来。

DeepSeek走的路非常稳健

DeepSeek的母公司幻方量化，是金融领域的头部基金，创始人梁文峰不光是位亿万富翁，同时也是一位有远大梦想的人，他给公司定下的愿景就是实现通用人工智能AGI。

在母公司幻方量化的帮助下，deepseek可以做非常纯粹的AI研究，不用考虑盈利的事情，这样的路会走的非常长远。

这不仅是一次技术上的发布，更是对全球AI格局的强烈冲击，让全世界看到了国产AI的无限潜能，也令我们对中国AI的未来充满期待。

对了，我整理了一份Cursor官方指导手册（中文版）。该⽂档写得相当清晰简洁，是新⼿⼊门开始学习Cursor的最佳选择。想要学AI编程的同学，加我微信，备注【Cursor】，免费获取！

·············· END ··············

你好，我是汤师爷，南京大学硕士，曾就职于华为、阿里，创业公司CTO，现大厂资深架构师，Qcon、IAS、A2M大会特邀讲师。日常分享AI编程，系统架构，AI工具，欢迎围观。

欢迎把文章分享至朋友圈

点赞、在看是对我最大的支持

↘↘↘

架构师汤师爷

南京大学硕士，曾就职于华为、阿里，创业公司CTO，现大厂资深架构师，Qcon/IAS/A2M大会特邀讲师。日常分享AI编程、系统架构、AI工具。

最新文章

国产之光DeepSeek杀疯了

春节假期卷起来！

月薪超6万！真心建议架构师冲一冲这个新兴领域，人才缺口极大！

SaaS系统定位分析，大部分人都做错了！

30岁后，一定要有体系化思维！

真的很厉害，强烈推荐这位大佬的 Redis、Tomcat、Kafka 系列

总监思维：公司不在乎你干了多少活

形势比想象的还要严峻

AI编程：这套提示词框架，让你效率飙升10倍！

架构设计黄金法则：区分变与不变，建立边界和结构的必看技巧！

如何画好一张架构图，如何分L0～L4级别？

一文搞懂企业架构与DDD的融合

国产之光DeepSeek，大模型里的拼夕夕

怎么感觉就业市场崩溃了。。。

一文搞懂SaaS架构建设流程：业务战略设计、架构蓝图设计、领域系统架构设计、架构治理与实施

万字图文：SaaS业务架构、价值流、业务能力、业务流程、业务对象、组织架构

国企央企员工，别指望能安稳干到退休了

一文搞懂架构设计的衡量标准：功能性、可用性、性能、可扩展性、安全性、协作效率、复杂度、成本效益

一文搞懂L1-L3业务流程体系分析，价值流、端到端流程、职能流程

Cursor AI编程不靠谱？

2025大厂最新薪资汇总

2025年，普通人积累第一桶金的3大技能

SaaS业务架构：从价值主张、价值流到价值流阶段分析

Windsurf 和 Cursor ，为什么我选择Cursor

一文看懂什么是架构?

大白话！解析大模型原理！

京东年终奖方案出了

吊打面试官！数据架构的核心概念

一文搞懂AI大模型的7个核心概念

国外第一批因AI失业的人出现了

新版本 Cursor 把其他 AI 编程工具按在地上摩擦！

Bolt.new vs Cursor ，怎么选？

o3 发布了，砸碎了码农的饭碗

促销系统：促销活动、优惠券、优惠规则概念模型设计

详解：促销系统整体规划

促销系统：促销业务详解

张一鸣，成为中国首富

一文搞懂业务架构的5个核心概念

我抛弃了 IntelliJ IDEA，拥抱这个爆火的 IDE！

履约系统：应用层、领域层、集成关系设计

履约系统：发货单、配送单模型设计详解

怎么感觉IT一下子就业崩溃了

详解：订单履约系统规划

AI编程：用 Cursor 写出第一个程序

交易系统：应用分层架构设计

京东不同职级薪资待遇

交易系统：退款单模型设计详解

交易系统：订单模型设计详解

交易系统：线上交易系统流程详解

试了下Cursor，感觉程序员工种危险了

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉