速递|见证历史!DeepSeek中美两区应用商店双双夺冠,ChatGPT第一次被中国应用超过了

文摘   2025-01-27 09:20   云南  

图片来源:DeepSeek

公开数据显示,DeepSeek已成功登上中国和美国苹果应用商店的免费应用榜单第一位。在美国市场,DeepSeek已超越ChatGPT,标志着中国AI产品在全球市场上实现了历史性突破。而在中国市场,DeepSeek也超越了豆包

美国对先进半导体的出口管制旨在减缓中国在人工智能(AI)领域的进展,但实际上可能无意中促进了创新。由于无法仅依赖最新的硬件,DeepSeek这样的公司被迫寻找创造性解决方案,在有限的资源下实现更多的功能。

更重要的是,中国正在采取开源战略,并逐步成为全球最大、最强大的全开源AI模型提供者之一。

本月,DeepSeek发布了其R1模型,采用了纯强化学习等先进技术,打造出一款不仅是世界上最强大的模型之一,而且完全开源,任何人都可以检查、修改并在其基础上进行开发。

DeepSeek-R1展示了中国并未在AI竞赛中落后,实际上,通过这一令人惊讶的开源战略,中国可能会主导全球AI发展。通过开源具有竞争力的模型,中国公司能够提升全球影响力,潜在地塑造国际AI标准和实践。

开源项目还能够吸引全球人才和资源,为中国的AI发展做出贡献。这一战略进一步使中国能够将其技术扩展到发展中国家,可能将其AI系统——以及由此延伸的价值观和规范——嵌入全球数字基础设施。

DeepSeek-R1的性能在多个任务上与OpenAI的顶级推理模型相当,包括数学、编程和复杂推理。例如,在AIME 2024数学基准测试中,DeepSeek-R1的得分为79.8%,而OpenAI-o1为79.2%。在MATH-500基准测试中,DeepSeek-R1达到了97.3%,而o1为96.4%。在编程任务中,DeepSeek-R1在Codeforces上达到了96.3百分位,而o1为96.6百分位——尽管需要注意的是,基准测试结果可能并不完美,应该避免过度解读。

然而,最值得称道的是,DeepSeek主要通过创新而非依赖最新的计算芯片,达成了这一成就。

他们引入了MLA(多头潜在注意力机制),它将内存使用量减少至常用MHA(多头注意力)架构的5-13%。MHA是一种在AI中广泛使用的技术,用于同时处理多个信息流,但它需要大量内存。

为了使模型更高效,DeepSeek创造了DeepSeekMoESparse结构。“MoE”代表专家混合模型,意味着模型每次任务只使用少数几个组件(或“专家”),而不是运行整个系统。“稀疏”部分指的是仅激活必要的专家,从而节省计算能力并降低成本。

DeepSeek-R1的架构包含6710亿个参数,但在操作过程中仅激活37亿个,展现了惊人的计算效率。公司已在GitHub上发布了全面的技术报告,提供了关于模型架构和训练过程的透明信息。附带的开源代码包括模型的架构、训练流程及相关组件,使研究人员能够全面理解并复制其设计。

这些创新使DeepSeek的模型既强大又比其竞争对手显著更具成本效益。这已经在中国引发了推理价格战,预计这种趋势将蔓延到全球。

DeepSeek收取的API使用费用仅为OpenAI-o1的极小一部分。这一成本的大幅下降有可能使得更小的组织和独立研究人员能够使用以前无法接触的强大AI工具,从而实现AI技术的普及。

DeepSeek还开创了将其大模型能力蒸馏成更小、更高效模型的做法。这些蒸馏后的模型,参数范围从15亿到700亿不等,也都开源,为研究社区提供了强大且高效的创新工具。

通过将其模型免费提供商业使用、蒸馏和修改,DeepSeek正在全球AI社区内建立良好的声誉,并可能为AI开发的透明度设定新标准。

DeepSeek由梁文峰创办,他是中国顶尖的量化投资人之一。他的对冲基金High-Flyer为公司的AI研究提供资金支持。

在一次采访中,梁文峰向OpenAI发出了警告:“面对颠覆性技术,闭源所建的护城河是暂时的,甚至OpenAI的闭源方法也无法阻止其他公司赶超。”

DeepSeek是越来越多中国公司参与全球开源AI运动的一个例子,反驳了中国科技行业主要专注于模仿而非创新的看法。

今年9月,中国的阿里巴巴发布了100多款新开源AI模型,作为Qwen 2.5系列的一部分,支持29种语言。中国搜索巨头百度有Ernie系列,智谱AI有GLM系列,MiniMax则推出了MiniMax-01系列,这些模型在性能上与美国领先的模型相比具备显著的竞争力,并且成本大大降低。

随着中国继续投资并推动开源AI的发展,同时应对出口管制带来的挑战,全球技术格局很可能会在力量动态、合作模式和创新轨迹上发生进一步变化。这一战略的成功可能使中国成为塑造AI未来发展的主导力量,对技术进步、经济竞争力和地缘政治影响产生深远影响。

参考资料:

[1] How small Chinese AI start-up DeepSeek shocked Silicon Valleym, https://www.ft.com/content/747a7b11-dcba-4aa5-8d25-403f56216d7e
欢迎扫码加群参与讨论

---------END--------

我们相信认知能够跨越阶层,

致力于为年轻人提供高质量的科技和财经内容。

🚀 我们正在招募新一期的Z Explorer

Z Finance
我们相信认知能够跨越阶层,致力于为年轻人提供高质量的科技和财经内容。
 最新文章