2025 年 1 月,中国 AI 公司深度求索(DeepSeek)推出的开源推理模型 DeepSeek-R1,凭借其接近 OpenAI 顶级模型的性能、仅 1/30 的 API 成本以及完全开放的生态策略,在硅谷引发强烈震荡。
中国仅用 600 万美元就打造出了世界上最好的人工智能模型之一,而 Meta、谷歌、微软等公司则花费了数十亿美元。
国外已经有大量个人和中小企业用户转向到DeepSeek-R1,并开始使用它作为基座大模型训练自己的模型
这场由东方力量主导的技术革命,正迫使全球重新审视 AI 竞赛的底层逻辑
硅谷巨头的集体失态
微软 CEO 纳德拉在季度财报会上直言:"我们必须认真对待中国在 AI 领域的实质性进展"
Meta 员工匿名吐槽:"550 万美元就能颠覆行业,我们的几十个高管,每一个高管的年薪都超过这个数字"
网友则戏称其为"真正的 OpenAI"(开放免费的AI)
这家引发风暴的中国公司叫深度求索,来自杭州(没错,黑悟空也是杭州公司做的),由浙大高材生梁文锋创立,核心团队来自量化交易领域。正是这支汇聚数学高手的队伍,开发出令硅谷寝食难安的 AI 利器——DeepSeek-R1。
DeepSeek-R1 有多厉害?来看看它的四大杀器
1. 性能碾压:中国模型首入全球三甲
DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
在权威评测平台 lmarena.ai,R1 挺进前三,老版本 V3 位列第七
中国 AI 进入全球前 10,还位列三强,石破天惊
数学推理准确率 97.3%,代码生成能力超越 96%人类程序员
128K 长上下文处理能力+思维链透明度,双杀闭源模型
2. 成本颠覆:训练费仅为竞品 1/11
独创 MLA 架构,H800 芯片实现效率跃升
训练成本降至传统模型 5%-13%(557 万美元 vs Llama3 的 1.1 亿美元
比Openai O1便宜96.4%。
API 调用单价仅 OpenAI 的 1/30,这两天搞活动,百万 token 成本不到 5 毛钱
3、开放生态:重构技术民主化版图
Deeepseek是开源模型,简单理解,就是源代码分享给所有人,每个人都可以部署到本地免费用的AI大模型。如llama系列
相反,闭源模型就是源代码不公开,支付高昂费用才能使用的AI大模型
Deeepseek 完整分享了源代码+53 页技术论文,下载量突破 1200 万次
论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
允许免费商用和二次开发,形成"中国版 Hugging Face"生态
英伟达科学家评价:"这才是真正的 OpenAI 初心"
DeepSeek R1 是一个推理模型,在回答前都有推理过一个程
R1 把推理过程公开给你看,其他推理模型 o1 等确是个黑盒
微软研究院首席科学家 Dimitris Papailiopoulos 惊叹:“R1 的工程简洁性令人震撼——追求答案正确性而非过程冗余,这是硅谷忽视的创新维度。”
4、创新突围:制裁逼出的黑科技
在美国芯片禁令下,通过知识蒸馏和 MoE 架构突破算力封锁
思维链可视化技术让 AI 推理过程首次"透明化"
微软科学家惊叹:"工程简洁性颠覆行业认知"
硅谷的众生相
面对中国 AI 的突袭,硅谷巨头反应各异:
扎克伯格紧急追加 650 亿美元算力投资,被讽"用钱砸护城河"
OpenAI 创始人奥特曼暗讽"模仿技术",却遭网友实测打脸
不过奥特曼偷偷宣布放出了 o3-mini
Meta 工程师承认正"逆向工程"中国模型,内部质疑预算合理性
有赞扬的。Meta 的首席 AI 科学家 Yann LeCun 强调,这不应被解读为“中国在 AI 领域超越美国”,而是“开源模型正在超越专有模型”
总之,中国 AI 软件 Deepseek 的横空出世,让美国总统特朗普才宣布 AI 星际之门计划显得像个“土老肥”计划,人傻钱多的典范
从微软 CEO 纳德拉的公开表态到 Meta 内部的“逆向工程恐慌”,DeepSeek 的崛起不仅是一场技术革命,更暴露了硅谷巨头在高投入模式下的脆弱性
更难得是,Deepseek V1 将之前高昂的收费推理类型的AI 平民化了
使用入门
可以通过四个途径,使用DeepSeek :
第一 官方网站(chat.deepseek.com)免费使用
支持 50 文件批量上传(单文件 100M)
深度思考+联网搜索模式展现惊人潜力
独特 SVG 生成功能引发创作热潮
文件上传支持一次性上传 50 个,每个 100M,支持各类文档和图片(仅支持提取文字)
为了安全,用户上传后不支持互联网连接
如果同时打开“深度思考”、“联网搜索”,你会有惊喜
比如我问:尧舜禹的禅让是真的吗?
deepseek 开始思考,过程
它的结论是:尧舜禹禅让的传说,更可能是 历史真实与后世建构的结合体。它可能基于早期社会的某种权力过渡形式,但被战国秦汉的文献加工为道德化叙事。从考古和文献综合分析,“完全和平的禅让”难以确证,但“推举制”的雏形或局部存在。这一问题的讨论,本质上反映了古代历史书写中 事实与理想的交织。
deepseek 有一个超好玩的功能,生成 SVG 并运行
详见《涨粉超快!kimi+Deepseek,自动生成小红书图文海报 》
第二官方 APP
功能与网页版一致,同一账号下数据互通
3、开发者API
日均调用量突破3亿次,没有编程基础的小伙伴可以结合沉浸式翻译等应用使用
大家可以通过https://platform.deepseek.com 注册,取得API key,然后通过沉浸式插件的设置调用,详见《不容错过的免费翻译神器“沉浸式翻译”!》
后继我会做更详细的测试和应用案例介绍,建议关注本公众号
4、Ollama部署
Ollama 是一个用于在本地运行大型语言模型 (LLM) 的开源框架
可以本机先安装Ollama,再通过它安装各种开源大模型到本地
到ollama网站下载,安装Ollama。然后通过输入命令“ollama run deepseek-r1:1.5b”就可以完成部署。更改“1.5b”为其他模型,数字越大显存要求越高
行业启示录
这场东方风暴暴露了硅谷模式的致命伤:
高投入军备竞赛的脆弱性
封闭生态的技术局限性
创新路径的思维定式
正如卡内基研究员所言:"美国越制裁,中国越高效"
DeepSeek为代表的低成本创新、开源生态和灵活市场响应,正在重塑AI竞争规则。
AI竞争可能从“卷算力”转向“卷应用”和“卷成本”,这对依赖资本密集型投入的美国模式构成压力。
心动不如行动!快来试试这个超级神器吧!进入AI的奇妙世界
enjoy!
另外,还有两个福利送给大家
福利1,本公众号开通微信小程序AI问答助手啦,扫描二维码即可免费使用
福利2,本公众号的学习群再次开启会员通道
付费加入知识星球“AI变现研习社”后,即可取得本公众号 VIP 学习群加入方式!
扫描知识星球二维码,如下