超越ChatGPT登顶!来自杭州的DeepSeek火了,相关概念股集体大涨

时事   2025-01-27 11:32   浙江  
国产大模型公司杭州深度求索开发的Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。
DeepSeek概念股集体大涨,每日互动、航锦科技、南威软件、美格智能竞价涨停,飞利信、卓创资讯、思特奇高开超10%。

每日互动

华金资本

航锦科技

卓创资讯

消息面上,此前AMD宣布,已将新的DeepSeek-V3模型集成到Instinct MI300X GPU上,该模型旨在与SGLang一起实现最佳性能。

华经产业研究院报告显示,2023年国内智能体市场规模达59.81亿元,预计2024年突破百亿元。中国工程院院士邬贺铨在2025年ICT行业趋势年会上表示,2025年不仅是智能体的元年,也将是AI终端的元年。


诞生自杭州的DeepSeek

跻身美国App竞技榜前三



“神秘东方力量”DeepSeek给硅谷带来的浪花,还在不断增强,刚刚,DeepSeek-R1跻身大模型竞技榜前三,与ChatGPT-4o齐名,超越Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。

DeepSeek海外爆火

同在昨日,DeepSeek出现了短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。

对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。不过,官方状态页并未将这一事件标记为事故。

DeepSeek 因为其成本低廉但性能卓越的AI模型,引起了包括众多硅谷科技巨头在内的目光。

其卓越的性能在网友的实测中也得到了验证。在与R1展开的30场对抗中,DeepSeek胜率超过了80%。

去年年底,DeepSeek推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)数据显示,DeepSeek-V3在所有模型中排名第七,在开源模型中排第一,是全球前十中性价比最高的模型。

DeepSeek-V3大模型的核心技术创新是其迅速崛起的关键。该模型融合了Multi-head Latent Attention(MLA)、混合专家架构(MoE)和FP8低精度训练三项技术,显著提升了性能与效率。

而在本月20日,DeepSeek又正式开源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena综合榜单上排名第三,与OpenAI的顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1拔得头筹;在风格控制以及高难度提示词与风格控制结合的测试中,DeepSeek-R1均与o1 并列第一。

更重要的是,DeepSeek-V3 的训练成本仅为558万美元,远低于如训练成本高达7800万美元的 GPT-4。并且,其 API 服务价格也延续了过往亲民的打法。输入 tokens 每百万仅需0.5元(缓存命中)或2元(缓存未命中),输出 tokens 每百万仅需8元。

最近,来自加州伯克利大学在读博士 Jiayi Pan 的研究团队更是成功地以极低的成本(低于30美元)复现了 DeepSeek R1-Zero 的关键技术——顿悟时刻。

《金融时报》将其描述为震惊国际科技界的黑马,认为其性能已与资金雄厚的 OpenAI 等美国竞争对手模型相媲美。Maginative 创始人 Chris McKay 更进一步指出,DeepSeek-V3 的成功或将重新定义 AI 模型开发的既定方法。

1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。

这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。

所以也难怪 Meta CEO 扎克伯格、图灵奖得主 Yann LeCun 以及 Deepmind CEO Demis Hassabis 等人都对 DeepSeek 给予了高度评价。

在海外,OpenAI CEO Sam Altman 刚刚也试图剧透o3-mini使用额度,来抢回国际媒体的头版头条——ChatGPT Plus 会员每天可查询100次。

资料照片

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

潮新闻 记者 张云山 

责任编辑:董箫乐


点赞
分享
在看

钱江晚报
30多年一贯靠谱! 新闻快,资讯多,服务全!有用,有趣,有温度,尽在钱江晚报
 最新文章