首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

对DeepSeek的五大误解！

旅行 2025-02-06 08:47 中国香港

一家中国AI公司的开源模型引发了全球AI圈的地震！

DeepSeek的R1模型一经发布，就掀起了一场轩然大波。但在这场喧嚣背后，却弥漫着太多的误解和偏见。

19岁就获得博士学位、前Stability AI研究主管Tanishq 忍不住了，他直指这场风波中的五大谎言，揭开了这场AI恐慌的真相。

博士忍不住了，他直指这场风波中的五大谎言，揭开了这场AI恐慌的真相。

误解一：突然冒出来的可疑公司？

这个说法简直让人哭笑不得。

事实上，DeepSeek早在2023年11月就发布了业界领先的编程模型DeepSeek-Coder。整整一年来，他们稳扎稳打，不断推进技术创新。

看看这张进度图就知道了：

误解二：600万美元造不出这么强的模型！

这个质疑更有意思了。

根据DeepSeek-V3论文披露的数据：

论文中提到的550万美元仅仅是最终训练的成本。这还不包括：

前期大量的实验成本
研究人员高达百万美元的年薪
R1模型额外的强化学习训练费用

误解三：这是NVIDIA的末日？

这种说法简直是天方夜谭！

Tanishq博士表示，这完全是对算力扩展规律的误解。更高效的模型意味着同样的算力能发挥更大的价值，但并不意味着更多算力就没用了。

lee(@LeeLeepenkman) 补充道：「NVIDIA现在获得了更好的算法来运行他们的机器，可以用相同的硬件进行更高价值的计算。」

误解四：抄袭美国公司？

事实恰恰相反！DeepSeek带来了多项重要创新：

多潜在注意力机制：比传统的多头注意力更节省内存，性能更优
GRPO可验证奖励：创新的强化学习方案
DualPipe：全新的多GPU训练方案，大幅提升训练效率

误解五：靠吸取ChatGPT的知识？

美国政府AI顾问David Sacks和OpenAI都提出了这个质疑。但问题在于：

如果使用公开数据集，这完全是合法的
R1模型的推理能力完全是自己的创新，因为o1的思维链过程从未公开过

Brandon Starks(@brandamnnnn)指出：「现在的战场在软件层面。想要赢的软件公司，都会想要获得最好的工具。这并不复杂。」

这场风波告诉我们：技术创新不分国界，而恐慌往往源于误解。

与其陷入无谓的争论，不如关注DeepSeek带来的技术突破。

最后，Magnus Ahlden 说到：

人们总是倾向于把它简单地看作『中国版拷贝』，而不是承认这个版本背后有多少伟大的创新。

👇

👇

👇

👇

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

关注AGI 的沿途风景！

最新文章

从DeepSeek R1看推理模型的四种进化路线

对DeepSeek的五大误解！

重磅！Gemini 2.0全家桶发布：Flash免费用，Pro会写代码，还有一个便宜货

传言称Grok-3延迟！但马斯克仍手握最强算力

Deep Research 开源版来了！立省200美元

魔幻现实之：美国人下载DeepSeek 将坐牢20年？！

爆料：Anthropic 有比o3 更强的模型，但不敢放出来

Lex Fridman 最新播客：Deepseek与o3-mini，芯片管制与中美竞争、AI Agent与AGI……

华为突围：910C芯片性能达H100的60%！DeepSeek 已验证

OpenAI Deep Research上线：人类研究员失业倒计时？

基于o3-mini 的浏览器agent，打造属于自己的Operator

伯克利教授：AI思考的越多，越容易出错

o3-mini 的10 大疯狂应用案例！

指责DeepSeek 的OpenAI 们才是真正的賊！

特斯拉：This robot sucks!

Yann LeCun 痛批硅谷精英的优越感！

o3-mini 发布，但仍未走出DeepSeek 阴影

美分析机构称DeepSeek V3 成本远超600 万美元，实际达13亿美元！

OpenAI 最强模型o3 今晚发布！

重现Deepseek R1 「Aha Moment」的完整教程来了！

当马斯克的脑机接口卷到了书法界，我们正在见证史上最硬核的意念书法大赛！

Stable Diffusion 创始人：DeepSeek 没有抄袭！

Anthropic CEO：DeepSeek 为落后的追随者，需进一步加强中国芯片管制！

OpenAI 称有证据证明DeepSeek违规使用其模型！

Grok 重磅推出推理能力，Grok 3 或指日可待！

DeepSeek严正声明：警惕虚假账号冒充！

手把手教学：40000 元在家跑顶级DeepSeek R1的完整方案！

重磅！OpenAI 推出美国政府专用版ChatGPT Gov！

Meta 或成开源竞赛中最大输家！

DeepSeek 入场，Meta 或成开源竞赛中最大输家！

终于，Sam Altman 正面迎战DeepSeek！

量化压缩80%！160GB就能运行671B的DeepSeek R1

炸裂！DeepSeek 的新春礼物——多模态模型Janus-Pro 详解

DeepSeek 爆火遭Scale AI 华裔 CEO Alexandr Wang 痛批：美国必须加强对中国AI 管制！

继Operator 之后，Perplexity 推出多模态助手！

马斯克：OpenAI 星门计划将流产！

DeepSeek R1 6百万美元训练成本是否真实？

试用完 OpenAI 的新代理工具，以下是我们的发现

哈佛医学院：AI 将治愈癌症，Sam Altman 没在吹牛！

重磅！字节发布UI-TARS大模型，三句话搞定电脑操作！碾压GPT-4！

Perplexity发布Sonar API，提供实时信息搜索功能，一举超越所有搜索引擎和LLM！

Perplexity发布Sonar API，一举超越所有搜索引擎和LLM

重磅！OpenAI 宣布5000亿美元启动Stargate项目，「星门计划」再起波澜！

Anthropic发布 Agent 最佳实践指南！

重磅！Anthropic CEO 称将于2025年推出数字员工！

Perplexity CEO：印度应向中国学习模型研发！

DeepSeek R1 训练方法解析

超便携AI超算来了！这台「公文包」竟能塞下一台超级计算机

以小博大，DeepSeek-R1-Distill-Qwen-1.5B 开源模型击败GPT-4和Claude 3.5!

爬虫工程师将失业！Firecrawl 能让你一句话抓取全网数据！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉