DeepSeek掀起的行业冲击波持续扩散,其影响力早已不局限于科技圈,正以排山倒海之势向资本圈全面蔓延,在全球范围内掀起了一场AI领域的惊涛骇浪。
1月27日,由国产大模型公司深度求索开发的移动应用DeepSeek宛如一颗璀璨的新星,一举超越炙手可热的ChatGPT,强势登顶苹果美国区免费应用榜单。与此同时,苹果中国区应用商店的免费榜也传来喜讯,DeepSeek同样位列榜首。这款应用的火爆程度超乎想象,大量用户源源不断地涌入,给服务器带来了巨大的压力。继前一天下午出现局部服务波动,导致系统短暂崩溃数分钟后,DeepSeek在今日上午再次因流量过大而“宕机”,服务状态页面直白地显示网页/API不可用。DeepSeek方面回应称,此次宕机或许与服务维护、请求限制等因素脱不了干系。
DeepSeek能在短时间内迅速崛起,离不开其背后一系列先进的技术支撑。通过结构化稀疏注意力、混合专家系统、动态计算路由等前沿技术,DeepSeek成功地大幅降低了模型训练和推理的算力消耗。这一突破性的成果,宛如一颗投入平静湖面的巨石,在资本界激起千层浪,引发了市场对于算力需求下降的广泛担忧。
DeepSeek的推理模型DeepSeek - R1,在测试表现、训练成本和开源开放程度等多个关键基准测试中,都展现出了超越美国OpenAI最新模型o1的卓越实力,而其成本却仅为o1的三十分之一。在数学、代码、自然语言推理等诸多任务中,DeepSeek - R1的性能与OpenAI o1正式版不相上下,甚至在部分测试集上还能以微弱优势取胜。不仅如此,它的API服务定价极为亲民,每百万输入tokens仅需1元(缓存命中)/4元(缓存未命中),每百万输出tokens也只需16元,远低于同类大模型的API服务价格。如此高性价比的优势,不仅有助于开发者加速模型的功能迭代,解决目前模型存在的不足,也让DeepSeek迅速在市场上崭露头角,吸引了大量用户和开发者的关注。
从当前的发展态势来看,DeepSeek极有可能在2025年持续发力,逐步取代ChatGPT等流行AI软件的地位。它的出现,让Meta、谷歌、OpenAI等科技巨头感受到了前所未有的危机。Meta不仅成立了四个专门研究小组来研究DeepSeek的工作原理,试图改进旗下大模型Llama,降低训练和运行成本,其首席执行官扎克伯格还宣布,Meta计划在2025年投入超过600亿美元,加大对AI的投入,以应对来自DeepSeek的挑战。
DeepSeek的火爆还引发了资本市场的剧烈震荡。由于其显著降低了算力消耗,市场对AI行业的算力需求预期发生了巨大转变,进而导致相关科技股大幅下跌。其中,英伟达作为全球领先的GPU制造商,首当其冲,股价暴跌16.85%。此外,博通、微软等科技巨头的股价也纷纷受挫,美股芯片股更是全线下跌。这一系列的市场反应,充分显示了DeepSeek对资本圈的巨大影响力。
DeepSeek的成功,不仅是中国AI行业的一次重大突破,更是全球AI领域的一次深刻变革。它以其卓越的性能、低廉的成本和开放的态度,为AI行业的发展注入了新的活力,也为未来的技术创新提供了新的思路和方向。在未来的日子里,DeepSeek能否继续保持强劲的发展势头,彻底颠覆AI行业的格局,我们拭目以待,祝福国产早日击败🇺🇸。