DeepSeek、爆了!芯片、崩了!

文摘   2025-01-28 18:52   江苏  

汇集半导体行业资讯 技术前沿、发展趋势!


就在全球华人喜迎除夕之时,DeepSeek又“偷偷”发布了新的视觉多模态模型Janus-Pro-7B!

一、DeepSeek新模型发布导致市场动荡

在全球华人欢庆除夕之际,中国人工智能初创企业DeepSeek悄然发布了其最新的视觉多模态模型Janus-Pro-7B。此举引发市场震动,英伟达公司股价周一暴跌17%,市值瞬间蒸发5890亿美元(约合42000亿人民币),创下自2020年3月以来的最大跌幅,并打破了美国股市历史上的最大跌幅纪录。受此影响,整个市场均出现下跌,标准普尔500指数周一下挫1.5%,纳斯达克100指数更是下跌近3%。同时,其他主要芯片股如美光科技、Arm Holdings、博通和AMD等也纷纷走低。在国际市场,荷兰芯片公司ASML和ASM International以及日本芯片相关股票也普遍下跌。

DeepSeek的低成本策略引发了市场担忧,人们开始质疑美国大公司在人工智能领域的巨额投入是否值得。DeepSeek以低廉价格提供类似性能的AI模型,并发布了可与OpenAI和Meta Platforms Inc.相媲美的最新模型,这无疑对美国在人工智能领域的领先地位以及大型科技公司的投资回报构成了挑战。

二、DeepSeek公司及产品简介

DeepSeek由中国企业家梁文峰于2023年创立,并由量化对冲基金High Flyer提供资金支持。公司近期推出了一系列大型语言模型(LLM),包括DeepSeek-V3、R1以及多模态框架Janus-Pro和JanusFlow等。其中,R1在数学、代码、自然语言推理等任务上的性能与OpenAI的GPT-4模型相当,并在国外大模型排名Arena上的基准测试中取得了全类别大模型第三的好成绩,在风格控制类模型分类中与GPT-4并列第一。而Janus-Pro则在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion。

DeepSeek团队规模不到140人,主要由本土顶尖高校的应届博士、在读生及硕士生组成。他们通过对算法和模型架构的深入研究实现了技术突破,如自研的MLA架构和DeepSeek MOE架构。在成本控制方面,DeepSeek表现出色。例如,DeepSeek-V3仅用2048块H800 GPU,花费557.6万美元就完成了6710亿参数模型的训练,远低于其他顶级模型的训练成本。

在应用市场表现方面,DeepSeek应用成功登顶苹果美国地区应用商店免费APP下载排行榜,力压ChatGPT。在国内App Store免费榜上,DeepSeek同样位居第一。然而,在1月28日凌晨,DeepSeek却称遭受了大规模恶意攻击,其官网服务状态页面显示注册可能繁忙,但已注册用户可正常登录。

三、各方观点汇总

对于DeepSeek的崛起,各方观点不一。英伟达表示,DeepSeek的模型是“出色的AI进步”,并强调在开发技术时未违反美国限制获取先进芯片的规定。然而,一些分析师却表达了担忧。例如,杰富瑞分析师担心DeepSeek可能破坏当前依赖高端芯片和广泛计算能力、消耗大量能源的人工智能商业模式。而伯恩斯坦分析师则对DeepSeek的工具开发成本表示怀疑,并认为不应将其视为“奇迹”。

同时,也有一些人对DeepSeek给予了高度评价。Mark Andreesen称DeepSeek的产品是“见过的最令人惊叹、最令人印象深刻的突破之一”,并认为是“给世界的一份深刻礼物”。Raymond James半导体分析师Srini Pajjuri则表示,尽管DeepSeek无法像美国超大规模企业那样获得那么多计算能力,但它设法开发出极具竞争力的模型,这可能会在美国超大规模企业中推动更大的紧迫性。

四、其他市场动态

在美股市场方面,1月27日美股三大股指收盘涨跌不一。道指上涨0.65%,但标普500指数和纳指分别下跌1.46%和3.07%。大型科技股多数下跌,万得美国科技七巨头指数更是下跌3.59%。此外,银行股涨跌不一,而中概股则涨跌互现。华西证券预计未来一段时间美股大型科技股因估值和基本面因素易分化调整,其他一些行业重要个股也易回调。

总的来说,DeepSeek的新模型发布无疑给市场带来了巨大的震动。随着人工智能技术的不断发展,未来市场格局或将发生更大的变化。


 *声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,侵权欢迎联系我们删除!


往期推荐

半导体门户
半导体行业资讯、半导体商机、半导体招商、半导体企业及产品。
 最新文章