一夜登顶,
用“威胁”二字,并不算夸张。
因为这家成立不足两年的公司,不仅仅让英伟达相当难堪——英伟达的暴跌也对整个市场造成了冲击,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。
此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。
这次,中国人直接用微信可以注册、更不用美国信用卡,也不用担心,因为不慎被发现是中国用户,而被系统“歧视性”封号。
使用的丝滑程度,简直太扬眉吐气了。
假期在家的年轻人,有人开始用DeepSeek搞玄学;有人开始让DeepSeek给自己点职业规划;还有人用它规划了假期减肥食谱...
抛开AI功能本身,让老外震惊的一是效率之快。
2023年5月,DeepSeek刚刚诞生还是一家大模型创业公司;在中国的7家大模型创业公司中,它最不声不响。
结果仅仅成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型。
2024年5月发布开源模型DeepSeek V2,将推理成本降低近百倍,一跃成名。
直到今年春节期间1月20日,DeepSeek发布了性能对标OpenAI-o1正式版的新模型——DeepSeek-R1,在基准测试中超越了OpenAI的同类产品,被海外AI界称为“神秘的东方力量”。
二是成本之低,让巨头纷纷被打脸。
DeepSeek-V3的投入研发费用,只花了558万美元。这是什么概念?
Gemini模型的成本高达数十亿美元,DeepSeek不到其他顶尖模型训练成本的十分之一。
被行业视为“开源大模型之王”Meta的一个内部员工匿名爆料说,Meta的生成式AI部门对DeepSeek感到恐慌,原因是他们随便一个管理人员的薪资就超过了DeepSeek V3的总训练成本,他们根本无法向高管解释这件事。
不仅仅是便宜,而且是丧心病狂的便宜,抽象的便宜。
结果,DeepSeek很大程度上改变了大模型市场的根本逻辑,过去以为非常烧钱的现在发现没必要了。
外国人的震惊之处,就在于DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。
打个比方,就像同样造一辆电动车,别人成本30万它只要1万,这就让更多企业用得起AI技术。
花小钱办大事,穷鬼套餐给你米其林的体验。
中国有句老话叫做“便宜没好货”。
在体验DeepSeek之前,很多人也在质疑他到底好用到哪儿去,是不是吹大劲儿了。直到《黑神话悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。
DeepSeek强大的推理逻辑,哪怕不是高难度的场景,也能体会到厉害之处。
不搞科幻片那一套,是村口大爷都能唠明白的AI。
DeepSeek核心是推理型大模型,不是指令型大模型。
一个是快餐店员,按流程炸薯条、做汉堡,5秒出餐不说废话(指令型);一个饭店主厨,边炒菜边调整火候,他就能自己思考怎么做。(推理型)
DeepSeek不需要你写"专业提示词",就比如“西红柿炒鸡蛋怎么做?”
老款AI(如GPT-3)回答:"做西红柿炒蛋先放油。"
DeepSeek可能回答:“如果是铁锅,建议先把锅烧到冒烟再倒油,这样不粘锅;冰箱拿出的鸡蛋最好回温再用,炒出来更蓬松。”
接地气的程度也非常强悍,甚至给出了我多汁版、浓香版、甜口党、减脂版四个建议,还给出了《常见翻车救援》这种生活化的细节处理,比之前的AI更贴心。
这种细节差异,就是技术进步的关键。
它不仅能准确解答更重要的是,它会展示完整的思考过程。
有网友体验完跟刀哥说,“DeepSeek在汉语语境里简直无敌,他的建议更适合国人,而且最恐怖的是,他给我的感觉是一个推理能力十足的人。”
比如,他会结合上下语境,主动猜测我提问“西红柿炒鸡蛋”这个问题,可能是在测试它是否有自己说的这么聪明。
你能看到它是如何一步步推导的,就像一个优秀的老师在给你讲解。
DeepSeek还有一个了不起之处,那就是:开源。
OpenAI其实并不Open。ChatGPT 2.0之前OpenAI是开源的。但自从ChatGPT 3.0开始,它就选择了闭源。“OpenAI”变为了“CloseAI”。
而DeepSeek则不然,不仅完全开源,而且放出了详细的技术报告;不仅开源了自己最大模型。
不仅是面子上开源,甚至选择了最宽松的 MIT License 协议,也就是允许任何人免费使用、修改、分发,包括用于商业用途。
所以,国外很多人为DeepSeek举大旗,愿意拥护DeepSeek为真正的 OpenAI。
1月30日凌晨,攻击升级为由僵尸网络主导,攻击烈度相比1月28日暴增上百倍。调查显示,DeepSeek遭受的攻击IP地址均来自境外,还涉及暴力破解密码等手段。
而这时,中国科技圈反应出奇的一致,都在保护这个冉冉升起的新星。
华为昇腾人工智能芯片全面接入 DeepSeek-R1 模型,为DeepSeek提供强大的技术资源支持;泰山云、海康威视、网易、钉钉、菜鸟、阿里云、大华纷纷加入 DeepSeek 保卫战。
外网猜测,DeepSeek是不是“雇佣了一批高深莫测的奇才”?
但实际上:DeepSeek团队最大的特点就是年轻。
跟OpenAI有2000多人相比,DeepSeek算上梁文锋不到150人。
广东80后梁文锋组建起一支纯粹的本土研发团队:只有中国程序员,没有海归人才。不少人都是应届毕业生和毕业一两年的年轻人,反而将那些有7-8年工作经验的高手谢绝门外。
他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。
梁文锋自曝,选人的标准一直都是热爱和好奇心;这里很多人对做研究的渴望,远超对钱的在意。
这样浪漫主义的团对,也能在DeepSeek一些惊艳回答中窥见一二:
有孕妇提问“如何面对怀孕中孤独感”,它回答:“在很多人选择背对生命诞生的时代,孤独本身就是最温柔的反抗。”
有人对职场内耗感到恐惧,它鼓励:“职场人际是流动的河流,你自己才是职业生涯的船长”。
有人提问,去世的父亲能收到自己春节烧的纸钱吗,它主动反问愿不愿意分享一些跟父亲的瞬间,再给予安慰。
未来,超强性能的模型不再独属于算力巨头,而是属于每个人。
图片来源于网络,侵权请联系删除
@The End
点个在看 不错过刀哥辣评