走向分裂!DeepSeek与OpenAI终有一战

文摘   2025-01-31 07:00   日本  

点击蓝字 关注我们

DeepSee的AI模型R1与OpenAI的能力不相上下。

它们也有很大不同。

举个简单例子,DeepSee可以算是AI界的安卓,OpenAI称为是AI界的IOS。

AI模型R1特别擅长解决问题,性能与OpenAI的o1推理模型相当,但每次使用成本仅为后者的一小部分。

DeepSeek应用目前位居美国iPhone下载排行榜首位。

正如DeepSeek和OpenAI是截然不同的公司一样,R1和o1也采用了不同的技术。

DeepSeek的工作原理

DeepSeek利用发明以及受到类似限制的中国人工智能公司所采用的技术,减少了训练模型所需的数据处理。 

除了减少数据处理(从而大幅节省时间和计算成本)之外,还使用了一种名为专家混合的技术。

DeepSeek和其他一些人工智能开发人员的做法,类似于将问题委托给特定领域的专家。

每位专家所需的培训更少,从而减轻了对芯片同时完成所有任务的需求。

他们所采用的技术并不新鲜,但以如此大的规模应用这些技术,并抱有如此坚定的信念,却是新颖的。 

DeepSeek的方法在提出问题之前,需要更少的时间和能力,但在回答问题时需要更多的时间和能力。

该模型展示了如何通过思维链推理得出答案,这是一种技术,可以一步一步地更好地完成复杂任务。

OpenAI的o1模型采用思维链推理,但不会向用户展示幕后发生的事情。

更进一步说,DeepSeek模型产生的推理可用于训练较小的AI模型。

o1和R1都能够执行所谓的推理任务,例如编写商业计划或创建填字游戏。

表现

研究人员表示,用R1与OpenAI的一些顶级AI模型进行了测试,发现R1非常具有竞争力。

这些评估包括OpenAI开发的一项评估,该评估涉及AI模型必须自行完成的计算机编程任务,例如修补软件中的错误。 

R1的表现与o1相当,并且优于早期的模型o1-mini。 

开源社区已经创建了R1的较小版本,可以在手机和平板电脑上使用。

一些用户表示R1的写作和解决问题的能力令人印象深刻,请注意,该模型在特定类型的问题解决上的表现比o1等竞争对手更差。

成本

DeepSeek以更低的成本和没有先进芯片取得了与OpenAI相当的成果。

分析师表示,估计DeepSeek只需要约500万美元的芯片来训练,这忽略了开发研究和实验的成本。

目前尚不清楚DeepSeek在R1模型中使用了多少算力。

相比之下,OpenAI表示,训练GPT-4模型的成本超过1亿美元,未来的AI模型成本预计将超过10亿美元。

根据估计,对于下一个模型GPT-5,6个月的训练运行,仅在计算成本上就可能花费约5亿美元。

隐私和安全

DeepSeek拒绝回答敏感问题。

R1可以免费下载和使用,因此一些用户更愿意使用它。

愿意使用R1,因为它是开源的,而且更换人工智能模型很容易。

相比之下,OpenAI表示,它采用了一种新的安全训练方法,迫使o1模型遵守公司指导方针。

OpenAI的目标是防止人工智能模型越狱,并与美国和英国的人工智能安全机构达成了正式协议。

越狱人工智能模型涉及操纵它们,或试图绕过它们的安全控制。

开源与专有

DeepSeek已发布R1模型背后的权重或数值参数,供公众自由使用、下载和修改。

并未发布背后的训练数据,这导致该模型并非完全开源。

DeepSeek发布了报告,详细介绍了如何训练模型,人工智能专家表示,这有助于开发人员解读如何实现创新。

模型权重的发布也意味着开发者可以下载模型使用。

运营开源模型共享平台的Hugging Face表示,R1模型已被下载320万次。

与DeepSeek不同,o1是专有的,这意味着消费者和企业需要付费才能使用模型和服务。

虽然有些公司喜欢使用专有技术(因为它们经过了开发人员的审查,带有网络安全控制),但其他公司更喜欢开源技术,因为更容易定制和控制。



芯调查
关注全球芯片动态
 最新文章