刚刚过去的上周末,全球AI领域出现了一位意想不到的价格颠覆者。它并非出身于科技巨头或互联网巨头,而与知名量化私募幻方量化有着密切的联系。
12月26日晚间,AI公司杭州深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。公司称,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
它为什么火呢?主要有三个原因:
一,性能非常出色。
在许多测试中,它都超过了其他顶尖模型,比如GPT-4o和Claude 3.5 Sonnet。特别在数学和代码生成方面,表现尤为突出。
二,它的训练成本相对较低。只要600万美元就能完成训练,与其他顶级模型相比,性价比极高。
三,它是开源的。全球的开发者都可以免费使用和测试它。
DeepSeek用它的实力,让世界看到了来自东方的神秘力量。也许在未来的某一天,当人们谈论人工智能的变革者时,DeepSeek将与字节、阿里、华为等公司一样,成为中国科技崛起的重要代表之一。