戳上方蓝字关注我。
最近,DeepSeek非常火。春节期间,使用了几次,体验非常不错。
可以预见,AI在未来必将深度融入人们的日常生活和工作中,极大地提升效率、优化资源分配、改善生活质量,并推动社会的全面进步。
这就是科技的力量!
我们知道,任何事物的成功或火爆都不是偶然的,背后一定有其内在的原因、规律或逻辑。今天我们就聊一聊DeepSeek。
弯道超车,赢在创新
DeepSeek全球爆红后,有一段话含金量在不断上升。
中科院院士陈润生称,发展大模型不能靠堆芯片,向人脑学习、创新基础理论才可能弯道超车。
以下,是我们摘录的其两段原文讲话。
大模型这个系统,绝对不是靠着我们越堆芯片越多来实现,一定会向人的大脑去学习,把空间复杂度和时间复杂度压缩得更小,能耗降得更低,所以我自己觉得,最基本的问题,是要研究目前空间复杂度来完成计算的,智算的基础理论。
如果我们能够在基础理论上有所发展的话,那我们就是根本的和原始创新的,否则的话,所有的大模型都是follow。
这两段发言是陈院士在2024年7月18日中国算力发展专家研讨会上的发言,可以说DeepSeek的爆火对这两段话做了最佳印证。
有网友认为,人类大脑功耗这么低,计算能力却特别强,好好学。
如此来看,未来可能真的没必要去堆芯片,就能实现弯道超车。
DeepSeek横空出世,掀翻美股!
1月27日苹果App Store中国区免费榜显示,DeepSeek站上首位,同时其在美区苹果App Store免费榜,从26日的第六位飚升至第一位,超越ChatGPT、Meta旗下社交媒体平台Threads、Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
DeepSeek表示,DeepSeek-R1在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版。
这一消息震动了全球AI圈,迅速引起国际社会广泛关注与讨论“高性价比”引发AI圈震动,DeepSeek-R1大模型发布之前,DeepSeek公司就已经因为“性价比高”,而引发AI圈震动。
中国DeepSeek的模型开发成本低、耗时短,性能却可比肩美国顶尖模型。这令市场对英伟达芯片的需求是否合理产生疑虑,导致投资者重新评估投资选项,1月27日英伟达股价暴跌约17%,市值蒸发5890亿美元。
不止英伟达,微软、谷歌母公司Alphabet、Meta等美国主要科技股均遭遇股市地震,跌得稀里哗啦。
公开资料显示,DeepSeek成立于2023年7月17日,是一家创新型科技公司专注于开发先进的大语言模型(LLM)和相关技术。
2023年11月2日,DeeSeek推出首个模型DeepSeek Coder,该模型免费供商业使用,且完全开源。
2023年11月29日,DeepSeek LLM上线,其参数规模达到67B,性能接近GPT-4,同时还发布了,该模型聊天版本DeepSeek Chat。
2024年5月,DeepSeek-V2发布,该模型在性能上,比肩GPT-4 Turbo,价格却只有GPT-4的百分之一。
2024年12月底,DeepSeek-V3发布,其性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近,但训练成本极低,整个训练在2048块英伟达H800 GPU集群上完成,仅花费约557.6万美元。相比之下,GPT-4o等模型至少要在万个GPU量级的计算集群上训练,且使用的是性能更为优越的H100 GPU,训练成本约1亿美元。
DeepSeek-V3发布后,英伟达高级研究科学家Jim Fan在社交媒体上表示DeepSeek是2024年度开源大语言模型领域的“最大黑马”。
DeepSeek R1被讨论的焦点,集中在两方面,低训练与使用成本以及开源。
区别于OpenAI“海量数据投喂”的方式,DeepSeek利用算法,把数据进行总结分类,经过选择性处理之后,输送给大模型,在提高训练效率的同时也降低了DeepSeek的成本。
DeepSeek创始人梁文锋表示,开源更像一个文化行为而非商业行为,在颠覆性的技术面前,闭源形成的护城河是短暂的,即使OpenAI闭源也无法阻止被别人赶超。
DeepSeek创始人还曾表示,“创新首先需要自信”。他相信中国AI不会“永远跟随”,希望DeepSeek以创新贡献者的身份加入新的技术浪潮之中。
DeepSeek的横空出世,或许让硅谷新贵第一次意识到,技术护城河困住的,也许不过是自己的傲慢。
今年1月20日,最新开源模型DeepSeek R1的发布在全球范围内引发持续轰动。该模型的研发仅耗时不到两个月。
它具有所有熟悉的功能,对标OpenAI o1模型,但运行成本仅为OpenAI、谷歌或Meta的流行人工智能模型的极小部分。
其基础模型的计算能力仅花费了不到600万美元,而美国公司在人工智能技术上花费了数亿或数十亿美元。
这意味着DeepSeek实现了高性能与低成本的平衡。而国内大模型行业第一场真正意义上的“降价潮”,也是由这家公司掀起的“价格战”引起。DeepSeek因此有“价格屠夫”之称,也有人称之为“AI界的拼多多”。
特朗普称,DeepSeek的出现“给美国相关产业敲响了警钟”,美国“需要集中精力赢得竞争”。特朗普同时表示,他认为,DeepSeek的模型高效且经济,其出现是一种积极的发展。
值得注意的是,特朗普这几天一直在阅读有关中国和中国一些公司的资料。
特朗普的表现,让我想起了《亮剑》中的一句话。
不管你愿不愿意接受,这是事实。.....不是洪水猛兽,当你碰到它时,你不应当回避,更不应当退却,而应当主动的去融入它,了解它,从而得出你自己的判断,当你得出自己的判断以后,你应当坚信你自己的判断。—— 都梁 《亮剑》
由此可以看出,特朗普在很短时间内,深入地了解了DeepSeek,并且给出了自己的判断。
国运级别的科技成果,未来可期!
总结一下,DeepSeek的爆火凭借的是其技术创新、成本效益、开源策略。有分析指出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。
《黑神话:悟空》制作人冯骥也发文评价了深度求索旗下的 DeepSeek,并表示其可能是个国运级别的科技成果。冯骥原文内容如下:
年前还是认真推下 DeepSeek 吧。
V3 已经用了一个月,但 R1 仅仅用了 5 天,不得不来发这条微博。
先讲一句暴论:DeepSeek,可能是个国运级别的科技成果。
为了讲清楚这个成果有多惊人,我打个比方:如果有一个 AI 大模型做到了以下的任何一条,都是超级了不起的突破 ——
1、强大。比肩 O1 的推理能力,暂时没有之一
2、便宜。参数少,训练开销与使用费用小了一个数量级
3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的 mini 模型。
4、免费。官方目前提供的服务完全免费,任何人随时随地可用
5、联网。暂时唯一支持联网搜索的推理模型(o1 还不支持)
6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成
上面的六条,DeepSeek 全部、同时做到了。
实在太 6 了,6 到不真实。
如果这都不值得欢呼,还有什么值得欢呼?
那么,现在看到这条微博的你应该去做什么呢?
1、请直接访问:网页链接 马上用起来,也有移动 App
2、使劲用,疯狂用,尝试用它基本取代传统搜索。请想象你已经认识每个领域的顶尖专家,而且他们都是你随时在线的好朋友,把所有可能需要“请教别人”的问题,都拿去先问它 —— 无论是构建一个复杂函数,搞清楚附近哪个游泳池最好,检查合同里的法律陷阱,让新写的歌词再押韵点,或者帮父母确认某个保健品是否真的有效
3、去看看别人是怎么用的,去试试其他大模型,了解 AI 擅长什么,不擅长什么,如何调教,然后继续解锁与迭代属于自己的用法与更多工具
希望 DeepSeek R1 会让你对当前最先进的 AI 祛魅,让 AI 逐渐变成你生活中的水和电。
太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。
知识与信息平权,至此又往前迈出了坚实的一步。
冯骥的评论,个人认为是非常中肯的。
DeepSeek的崛起打破了美国在AI领域的垄断地位,提升了我们在全球科技竞争中的地位,推动了全球AI技术的发展。因此,DeepSeek被称为“国运级别的科技成果”应该是当之无愧的。
最为可喜的是,DeepSeek由一家年轻的中国公司——深度求索开发完成,团队成员均为本土人才,没有海外经历或资深从业经验。这一成就展示了中国在AI领域的自主创新能力,更会激励更多年轻人投身AI领域。
不得不说,DeepSeek让我们为之振奋,眼前一亮,对未来产生了更多的期待。