美国CNBC电视台报道中国DeepSeek性能超越当前顶尖模型,OpenAI、Meta等行业领袖护城河正在缩小!

科技   2025-01-01 10:24   四川  

中生代大白

读完需要

3
分钟

速读仅需 1 分钟

据美国 CNBC 电视台报道,中国的 DeepSeek 模型在关键基准测试中击败了 OpenAI 和 Meta 的最新模型,这意味着 OpenAI 等行业领袖的护城河正在缩小;

12月26日发布的DeepSeek-V3 在多个关键基准测试中脱颖而出,成功击败了包括 Qwen2.5-72B 和 Llama-3.1-405B 等在内的众多开源模型,其性能甚至能够与顶尖闭源模型 GPT-4O 和 Claude-3.5-Sonnet 相媲美。无论是在知识类任务、长文本处理,还是代码编写和数学竞赛等方面,DeepSeek-V3 都展现出卓越的能力。例如,在密文解码任务中,它是唯一能够给出正确答案的大模型;在代码生成任务中,它所提供的代码注释、算法原理解释以及开发流程的指引也是最为全面的。

更为引人注目的是 DeepSeek-V3 的训练成本优势。它的训练成本极低,共计266.4万个GPU小时,仅花费了大约557.6万美金(约4070万元人民币),这与一些国际顶尖 AI 模型相比,只是其花费的 1%。像 Meta 的大模型 Llama-3.1 的训练投资超过了 5 亿美元,而 GPT 和 Gemini 模型更是耗费了数十亿美元。这使得 DeepSeek-V3 在性价比上具有极大的优势,正如 OpenAI 创始成员 Karpathy 所说:“DeepSeek-V3 让在有限算力预算上进行模型预训练变得容易。DeepSeek-V3 看起来比 Llama-3-405b 更强,训练消耗的算力却仅为后者的 1/11”。

DeepSeek 模型的崛起对全球 AI 行业格局产生了重大影响。对于 OpenAI 等行业领导者来说,他们的护城河正在逐渐缩小。一方面,技术门槛的降低使得其他企业和研究机构有可能通过类似的技术创新和优化方法,在不需要巨额投资和高端资源的情况下,开发出具有竞争力的模型,从而对其主导地位构成挑战;另一方面,市场竞争也因 DeepSeek 的出现而变得更加激烈,美国的一些 AI 企业面临着巨大的压力,其市场份额和盈利能力可能会受到冲击。

在中国 AI 行业快速发展的浪潮中,人才的争夺也成为了关键。雷军以千万年薪招揽了 DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉。罗福莉有着出色的学术背景,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业,在学术研究上成果斐然。2019 年,还在北大读硕士的她就在人工智能领域顶级国际会议 ACL 上发表 8 篇论文,其中 2 篇一作。毕业后,她先后在阿里达摩院、幻方量化等企业从事与 AI 相关的工作,积累了丰富的经验,在 DeepSeek 担任深度学习研究员期间,参与研发了 MoE 大模型 DeepSeek-V2,并取得了显著成果。今年 5 月,在 DeepSeek-V2 发布以后,罗福莉在知乎撰文,称 “单论 DeepSeek-V2 模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加 1 元 / 百万输入 tokens 的价格,只有 GPT-4 价格的 1/100,性价比之王”,进一步彰显了 DeepSeek 在 AI 领域的影响力和技术实力。

DeepSeek 为中国 AI 产业的发展提供了新的方向和动力。它证明了在算力竞赛之外,技术创新同样可以成为中国 AI 实现换道超车的重要途径。其低成本、高性能以及开源模式,将有力地推动中国 AI 产业的蓬勃发展,降低企业进入 AI 领域的门槛,促进 AI 技术在各行各业的广泛应用,进而带动相关产业的升级和经济结构的优化。同时激励着更多的中国企业和科研人员在 AI 领域不断探索和创新,为全球 AI 技术的发展贡献更多的中国智慧和力量。可以预见,未来全球 AI 行业的竞争将更加白热化,而中国有望在这场科技角逐中占据重要的一席之地。

  ◆    

往期推荐

深陷入黄仁勋的“显卡装备竞赛”人工智能公司们!微软字节腾讯脸书特斯拉亚马逊谷歌巨头等购买英伟达显卡超过150万张

年仅26岁的OpenAI吹哨人离奇死亡,曾认为人工智能弊大于利!马斯克发声;网友议论“OpenAI is evil”

被字节索赔800万元的北大博士田柯宇,获得人工智能顶级会议NeurIPS 2024 的最佳论文奖!字节要不800万年薪请回来?

雷军说小米自研了操作系统,做了人工智能大模型大模型,自建了全球最先进的工厂,是因为中国正在UP,并表示自己心态还非常年轻

“苹果不够聪明,无法制造自己的人工智能”,顶级大佬如此评价,想看到苹果的反击打脸...

大白聊IT
一个多年科技从业者分享点对科技的观察
 最新文章