DeepSeek击败ChatGPT:登顶苹果APP免费总榜 带崩英伟达美股夜盘

文摘   2025-01-27 12:04   泰国  

雷递网 乐天 1月27日

DeepSeek正迅速在中美AI圈走红。日前,DeepSeek击败ChatGPT,上升到中美两区应用商店免费App总榜第一。

DeepSeek的大火,也一度导致DeepSeek服务状态不稳,出现短时闪崩现象。DeepSeek称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。



DeepSeek大火背后,其价值在于,在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

此外,DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16元,用600万美元训练一个600B的大模型。

分析人士指出,DeepSeek用10-15分之一的成本就训练出比肩OpenAI o1水平的模型R1,而R1还都开源,这意味着算法有太多提高空间,不需要那么多GPU,不需要那么多算力,封锁芯片,搞算力壁垒的思路行不通,而OpenAI和Meta等美国企业靠GPU堆砌效果的模式也大打折扣。

这导致创业公司、个人App等可能大幅减少在OpenAI API上的支出,转向开源。这导致英伟达美股夜盘跌超5%,博通跌超4%。

黑神话悟空创始人评价DeepSeek,称DeepSeek比肩O1的推理能力,暂时没有之一;便宜,参数少,训练开销与使用费用小了一个数量级;

此外,DeepSeek开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;免费。官方目前提供的服务完全免费,任何人随时随地可用;联网。暂时唯一支持联网搜索的推理模型(o1还不支持)。

有分析人士指出,DeepSeek从技术突破到APP登顶,不仅改写了AI行业发展的轨迹,更有力地宣告了大模型轻量化的重要意义和所谓的scaling law的终结。这是技术极致主义的胜利,那些对OpenAI亦步亦趋,拿Scaling law忽悠,瞧不起中国人才的所谓大咖可以回去洗洗睡睡了。

“随着预训练和推理等关键技术的攻克,模型轻量化导致的成本的大幅度降低,开源带来的普惠,AI 应用的爆发之势已然蓄势待发,而智能体作为其核心载体,将开启一个全新的智能化时代。企业将可以用很低的成本实现应用大模型技术。可以预见,AI 发展的春天正向我们走来,无限可能正在这片创新沃土上悄然孕育。”

金沙江创投合伙人朱啸虎说,这是技术理想主义者的胜利,最难的是最简单的。专注于技术和创新,远胜投放买流量和PR;行业技术迭代周期远快于资本支出的回报周期,前期的重资本投入还未取得充分回报,就已经过时,需要加速折旧摊销,整个LLM行业都需要重塑估值体系。

互联网分析人士胡延平说,如果不看开源生态,只看C端直客角度,DeepSeek要想站稳,至少需要尽快具备多模态文生图文生视频理解图像、语音交互等能力,尤其类AVM、知识库、结合Agent等既有形态,能否形成模型矩阵和Apps生态等,可能会决定热度是短期还是长期,舆论热度能否充分转化为市场实地,及能否内与豆包、外与ChatGPT分食市场。

胡延平认为,从OpenAI CEO Altman晒出算力中心首期工程回应千亿美元星门计划质疑,Meta CEO扎克伯格公布130万卡600亿美元投资,字节加大自研AI芯片投资力度等密集动作来看,加速、捉急、斗法的气息,2025比2024年明显更重。

————————————————

雷递由媒体人雷建平创办,若转载请写明来源。

雷递财经
专注财经报道,创始人为商业财经畅销书《上市风云》作者。
 最新文章