点击蓝字 关注我们
DeepSee的AI模型R1与OpenAI的能力不相上下。
它们也有很大不同。
举个简单例子,DeepSee可以算是AI界的安卓,OpenAI称为是AI界的IOS。
AI模型R1特别擅长解决问题,性能与OpenAI的o1推理模型相当,但每次使用成本仅为后者的一小部分。
DeepSeek应用目前位居美国iPhone下载排行榜首位。
正如DeepSeek和OpenAI是截然不同的公司一样,R1和o1也采用了不同的技术。
DeepSeek的工作原理
DeepSeek利用发明以及受到类似限制的中国人工智能公司所采用的技术,减少了训练模型所需的数据处理。
除了减少数据处理(从而大幅节省时间和计算成本)之外,还使用了一种名为专家混合的技术。
DeepSeek和其他一些人工智能开发人员的做法,类似于将问题委托给特定领域的专家。
每位专家所需的培训更少,从而减轻了对芯片同时完成所有任务的需求。
他们所采用的技术并不新鲜,但以如此大的规模应用这些技术,并抱有如此坚定的信念,却是新颖的。
DeepSeek的方法在提出问题之前,需要更少的时间和能力,但在回答问题时需要更多的时间和能力。
该模型展示了如何通过思维链推理得出答案,这是一种技术,可以一步一步地更好地完成复杂任务。
OpenAI的o1模型采用思维链推理,但不会向用户展示幕后发生的事情。
更进一步说,DeepSeek模型产生的推理可用于训练较小的AI模型。
o1和R1都能够执行所谓的推理任务,例如编写商业计划或创建填字游戏。
表现
研究人员表示,用R1与OpenAI的一些顶级AI模型进行了测试,发现R1非常具有竞争力。
这些评估包括OpenAI开发的一项评估,该评估涉及AI模型必须自行完成的计算机编程任务,例如修补软件中的错误。
R1的表现与o1相当,并且优于早期的模型o1-mini。
开源社区已经创建了R1的较小版本,可以在手机和平板电脑上使用。
一些用户表示R1的写作和解决问题的能力令人印象深刻,请注意,该模型在特定类型的问题解决上的表现比o1等竞争对手更差。
成本
DeepSeek以更低的成本和没有先进芯片取得了与OpenAI相当的成果。
分析师表示,估计DeepSeek只需要约500万美元的芯片来训练,这忽略了开发研究和实验的成本。
目前尚不清楚DeepSeek在R1模型中使用了多少算力。
相比之下,OpenAI表示,训练GPT-4模型的成本超过1亿美元,未来的AI模型成本预计将超过10亿美元。
根据估计,对于下一个模型GPT-5,6个月的训练运行,仅在计算成本上就可能花费约5亿美元。
隐私和安全
DeepSeek拒绝回答敏感问题。
R1可以免费下载和使用,因此一些用户更愿意使用它。
愿意使用R1,因为它是开源的,而且更换人工智能模型很容易。
相比之下,OpenAI表示,它采用了一种新的安全训练方法,迫使o1模型遵守公司指导方针。
OpenAI的目标是防止人工智能模型越狱,并与美国和英国的人工智能安全机构达成了正式协议。
越狱人工智能模型涉及操纵它们,或试图绕过它们的安全控制。
开源与专有
DeepSeek已发布R1模型背后的权重或数值参数,供公众自由使用、下载和修改。
并未发布背后的训练数据,这导致该模型并非完全开源。
DeepSeek发布了报告,详细介绍了如何训练模型,人工智能专家表示,这有助于开发人员解读如何实现创新。
模型权重的发布也意味着开发者可以下载模型使用。
运营开源模型共享平台的Hugging Face表示,R1模型已被下载320万次。
与DeepSeek不同,o1是专有的,这意味着消费者和企业需要付费才能使用模型和服务。
虽然有些公司喜欢使用专有技术(因为它们经过了开发人员的审查,带有网络安全控制),但其他公司更喜欢开源技术,因为更容易定制和控制。