大家新年好~
大年初二,吃完年夜饭、看完春晚、走完亲戚,相信不少人已经进入了春节的自由时间。
常言道,新年新气象,今天咱们就聊点欣欣向荣的新玩意吧。
年前年后这几天,中美两国的互联网都在低语着同一个名字:
DeepSeek。
即便是在热度相对较低的国内,它也牢牢占据了热搜排行的三个名额。
相信各位应该也看过不少围绕DeepSeek展开的讨论了。
可能是DeepSeek的有趣实操,可能是国内外大佬对新兴语言模型的夸赞和点评。
可能是中国技术升级导致的AI产业美股暴跌,又可能是黑客对新兴企业发起的攻击。
那么,DeepSeek强吗?
很强,但强大并非它在众多国产AI模型中脱颖而出的理由。
站在用户侧的角度,DeepSeek在使用体验上比起最前端的AI并没有突破性的进步。
最新的DeepSeek-V3,只是在各方面参数追上GPT-4o和Claude-3.5的同时,更符合中国互联网用户的语言习惯。
可站在开发者跟同行的角度,DeepSeek的诞生堪称奇迹。
简单来说,一家金融公司幻方量化,在做着AI量化交易的时候,囤够了AI大模型的入场券。
随后依靠国内教育培养出来的应届博士生跟硕士生,只用557万美元,以及2048块阉割性能的英伟达H800 GPU,就做出了比肩顶尖大厂的AI模型。
这个成本,仅仅是Llama 3.1的1/10,GPT-4o的1/20,而且这些顶尖模型使用的还是因美国禁售不得进入中国的满血版芯片。
在紧迫的硬件算力限制下,DeepSeek团队实现了多种算法和框架上的优化和创新,不过这毕竟不是咱专业,这里就不多赘述。
可以说,对比大厂“力大砖飞”的思路,DeepSeek达成了工程上的胜利。
极致的成本控制,让DeepSeek跟GPT接入API的价格也天差地别。
最昂贵的DeepSeek R1每百万输入token仅需0.55美元,输出则是2.19美元。
对比OpenAI最新的收费,输入15美元,输出60美元,差距足足27倍。
哪怕是热衷零元购的美国老哥,看到这性价比也得惊掉眼球。
因此有人将DeepSeek称为AI拼多多,称赞其物美价廉的特色。
但比起AI拼多多,我更愿意称其为AI界的小米加步枪。
同样是面对物质基础的封锁,同样是面对看似不可战胜的对手,新时代的中国人和先辈们一样,在重重困难中,收获了成功。
DeepSeek成功的意义,也并不只是追上了国际顶尖水平那么简单。
自AI大模型面世以来,几乎所有入局的企业,都把硬件算力放到了第一位。
这些年AI大模型的发展,也从最初那令人惊叹的算法,变成了硬件算力的“军备竞赛”。
但DeepSeek证明了一件事,软件层面的算法依旧有很大的进步空间,不靠硬件的力大砖飞,也能做出世界一流的AI。
更重要的是,相比闭源的ChatGPT等顶尖模型,DeepSeek是开源的。
无论是受美国制裁限制的中国企业,还是负担不起高昂硬件成本的海外创业公司,接下来想要入局AI行业,必定能从中得到启发。
高兴之余,我们也该看到,围绕DeepSeek展开的言论也不全是好事。
比如来自前辈同行的盗窃指控。
暂且不评价把业界通行做法,尤其是你OpenAI自己也在干的事情称为盗窃是个什么操作。
但看到那个因算法创新而惊艳世人的OpenAI这几年不仅没啥大突破,反倒加入算力竞赛,价格也变得越来越高昂,我感到非常痛心。
果然会成为恶龙的,总是曾经的屠龙者。
不过这样的故事,这些年相信大家已经看过不少了。
神威·太湖之光,探月工程,量子卫星,天宫空间站,第六代战机,中国高铁,智能手机,新能源汽车等等领域。
从一开始的卡脖子封锁,到自力更生进步,再到超车后遭受诋毁,已经成了中国技术突破必不可少的一套流程。
最后,我想借用《文明6》的开场旁白,来做一个总结。
从太湖之畔亮起的第一道光芒开始,到嫦娥五号留下探月的印记,再到六代机定义苍穹法则,高铁行驶于崇山峻岭,新能源汽车征战出海,国产AI跻身世界一流,你已经历许多。
现在,开启你伟大的复兴吧。
未来很有戏