DeepSeek的出现震动了AI界,该公司打造出一款能与 OpenAI 产品相抗衡的模型,且成本仅为其零头。这一发展对AI行业及全球市场意义重大。
下面我们来探究 OpenAI 与 DeepSeek 之间的关键差异、DeepSeek 产生市场影响的背后原因及其面临的挑战。
OpenAI 与 DeepSeek:两种路径的故事
1. 模型架构与性能
OpenAI 的最新模型 o1 和 DeepSeek 的 R1 都通过思维链方法运用了先进的推理能力。
然而,DeepSeek在关键基准测试中取得了相近甚至更优的表现,尤其是在数学、编程和自然语言推理方面。值得注意的是,从理论上讲,DeepSeek 比 GPT - 3 和 GPT - 4 更为先进。
2. 成本与效率
最显著的差异体现在开发与运营成本上。
DeepSeek 报告称其 V3 模型的训练成本仅为 560 万美元,而 OpenAI 则花费数亿甚至数十亿美元。
这种成本效益在推理方面也有所体现,DeepSeek 的 API 服务价格仅为 OpenAI 的几分之一(有消息称 DeepSeek 为 0.55 美元,而 OpenAI 为 15 美元)。
3.开源与专有
DeepSeek 采取了开源方式,在宽松的许可下发布其模型。这与 OpenAI 更为封闭的专有策略形成对比,对研究的可及性和社区参与度都有不同影响。
挑战与限制
尽管成就斐然,DeepSeek 仍面临一些紧迫挑战:
1. “防火墙”与内容审查:
不过,由于它是开源的,一旦模型在其他地区托管,这个问题或许很快就能解决。
2. 硬件限制下的训练
尽管美国对高端 GPU 实施出口管制,DeepSeek 仍有能力训练先进模型,这一点值得关注:
创新架构:
DeepSeek 开发出一种独特方法,能在不太先进的硬件上优化性能,比如面向中国市场设计的英伟达 H800 芯片(有些资料提到了在中国受限的 A100 芯片)。
高效算法:
该公司专注于创建高效的训练算法并优化基础设施,以克服硬件限制。
资源整合:
有人猜测:DeepSeek 利用了制裁前已有的 GPU(A100)库存,并与其他中国的实体合作获取计算资源。
市场冲击:DeepSeek 效应
2025 年 1 月 27 日,DeepSeek 的声明在科技行业引发轩然大波,造成显著的市场波动:
美国股市暴跌:
主要科技股,尤其是与人工智能相关的股票大幅下跌。人工智能硬件领域的关键企业英伟达股价一度暴跌 18%,市值蒸发超 5000 亿美元。
人工智能投资重估:
DeepSeek 模型的成本效益让投资者对美国公司在人工智能开发上的巨额投资产生质疑。
竞争格局转变:
DeepSeek 的出现挑战了美国公司在人工智能领域的主导地位,有可能重塑全球人工智能的力量格局。
AI的斯普特尼克时刻
DeepSeek 的崛起促使行业领袖和政策制定者称其为“人工智能的斯普特尼克时刻”,表明中国正在技术主导权的竞争中领先。与硅谷青睐的缓慢、资本密集型方法不同,中国的模式强调速度、效率和降低成本。
DeepSeek R1 的开发证明,尖端人工智能并不需要庞大的GPU农场或高昂的电费——至少在中国不是这样。
特朗普上周宣布了一项涉及 OpenAI 和 Nvidia 的 5000 亿美元人工智能基础设施项目-“星际之门”(Stargate),旨在重新夺回人工智能领域的主导地位。“星际之门”将专注于促进人工智能基础设施、培训资源和研究方面的创新,以应对像 DeepSeek 这样的低成本高效中国模型
结论
DeepSeek 的崛起标志着人工智能格局的重大转变,挑战了关于前沿人工智能开发所需资源的传统认知,引发了关于全球人工智能的诸多讨论,DeepSeek 的崛起不仅仅是对 Nvidia 的挑战;它可能会重塑整个AI格局。随着竞争加剧,老牌公司将被迫更快地创新。
拥有突破性技术的新创企业可能会越来越多地占据市场的重大份额。
这种影响可能会波及行业的各个方面,从产品开发周期到营销策略。为了保持竞争优势,企业可能需要更积极地投资于研究和开发。
由 DeepSeek 引发的颠覆不仅仅是行业的洗牌;它为所有利益相关者提供了创新、合作并在技术领域开辟新道路的机会。未来几个月将是关键时刻,让我们拭目以待。