近日,DeepSeek 创始人梁文锋受邀参加座谈会并在新闻联播中亮相。梁文锋作为 AI 初创公司深度求索(DeepSeek)的创始人,以这一身份参与国家超高规格座谈会并现场发言。
1 月 20 日,DeepSeek 在官微正式发布 DeepSeek - R1,性能对标 OpenAI o1 正式版,并同步开源模型权重。
其 API 服务定价远低于 OpenAI o1,每百万输出定价大概仅为 OpenAI o1 的 3.65%,有极高的性价比。
此外,DeepSeek - V3 仅使用 2048 块 H800 GPU 就完成了 6710 亿参数模型的训练,成本仅为 557.6 万美元,远低于其他顶级模型的训练成本。
作为对比,OPen AI 的 GPT - 4 同规格训练模型则需花费 10 亿美元,是 DeepSeek 的 179 倍。
1 月 24 日,在国外大模型排名 Arena 上,DeepSeek - R1 基准测试升至全类别大模型第三,在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。
这一系列成果使 DeepSeek 引发了美国 AI 科技圈的极大震动,NVIDIA 的高级研究科学家给予高度评价,AMD 也火速为其 “站台”,甚至还有人把 DeepSeek 称为 “美国股市最大的威胁” 等。
DeepSeek可以说是一家神秘的中国AI公司,被称为“AI界的拼多多”。最新发布的R1模型凭借低成本,出色的性能表现刷屏全球各大主流媒体和社交网站,尤其让美国AI科技圈极为震撼。
对此有网友表示,在外网逛了一圈儿,感觉deepseek给老外带来的震撼已经超过上个月的六代机了。