中国AI大模型,震惊硅谷

文化   2025-01-01 09:55   新西兰  

刚刚过去的上周末,全球AI领域出现了一位意想不到的价格颠覆者。它并非出身于科技巨头或互联网巨头,而与知名量化私募幻方量化有着密切的联系。


12月26日晚间,AI公司杭州深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。公司称,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。


它为什么火呢?主要有三个原因:


一,性能非常出色。

在许多测试中,它都超过了其他顶尖模型,比如GPT-4o和Claude 3.5 Sonnet。特别在数学和代码生成方面,表现尤为突出。

二,它的训练成本相对较低。只要600万美元就能完成训练,与其他顶级模型相比,性价比极高。

三,它是开源的。全球的开发者都可以免费使用和测试它。


DeepSeek用它的实力,让世界看到了来自东方的神秘力量。也许在未来的某一天,当人们谈论人工智能的变革者时,DeepSeek将与字节、阿里、华为等公司一样,成为中国科技崛起的重要代表之一。

疯狂熊猫青年联盟
疯狂熊猫于2011年9月由一帮热血青年创建,是一个关注青年成长,提升青年认知,助推青年梦想的公益组织,迄今为止已举办微梦想,微电台,微旅行,话聊会,脱口秀等活动百余场,我们的口号是“有趣,有梦,有爱,趁现在!”
 最新文章