蛇年吉祥

百科 2025-01-29 01:00 北京

春节好！

蛇年来临之际，中国一家名不见经传的人工智能（AI）企业杭州深度求索推出了Deepseek-R1开源模型。以其难以置信的低成本（训练成本不到6百万美元）和能够比肩AI界巨头openAI的闭源模型chatGPT4的性能在AI界掀起了一场革命。

第一个在这场狂潮中被打得鼻青脸肿的是英伟达，其股价在1月27日收盘时已经暴跌17%，市值跌去了约5890亿美元。纳斯达克的总市值当天跌去了约一万亿美元。

美国股市动静之大连懂王都坐不住了，当然他未必懂啥叫大模型，但他知道股市市值比啥都重要。要是听任美国股价就这么扶摇直下，那他这个大统领的宝座可就悬了。所以得出来安抚一下。

根据深度求索发布的论文，Deepseek与主流产品的区别在于它使用了混合专家模型（MoE)和强化学习（RL）以及独创的多头潜注意力（MLA）机制。从而大幅度降低了训练成本。而国外企业的训练成本一般被认为是上亿美元。因此Deepseek趟出了一条新路，不是像之前的国内外企业那样堆算力，而是优化了算法，降低了对硬件的要求。深度求索表示DeepseekR1使用了2000块英伟达的H800型GPU卡，这是一种针对中国市场的阉割版GPU卡，其性能不如英伟达的A100卡。与openAI、Meta、微软之类动辄使用上万块A100卡的产品相比其成本只及后者的零头。足见Deepseek推出后给世界AI领域带来的轰动效应。

尤为可贵的是Deepseek核心团队里都是中国大陆自己培养的人才，基本没出过国，其中来自北大7人，清华4人，北邮1人，北航1人，中山大学1人。可以说，Deepseek的成功显示出中国青年科技人员的创新能力达到了出人意料的高度。

Deepseek是大语言模型（LLM），可以根据需要改写为视觉语言模型（VLM）。深度求索在英伟达股价暴跌当日发布了开源多模态人工智能模型 Janus-Pro-7B，也可以处理图像以及生成视频。

尽管没有Deepseek在军事领域应用的实例，由于其已经开源，其设计思想是很有可能被国内外的军工企业或研究机构借鉴来升级或改写自己的AI模型。比如，最近国防科技大学电子科学学院刘永祥和刘丽教授团队就提出了世界上首个公开发表的SAR图像目标识别基础模型SARATR-X 1.0。该模型是基于transformer架构的，如果参考Deepseek的成果，不知在降本增效方面能有多大的进步？

但无论怎么说，Deepseek横空出世，对于提升包括军事领域在内的各种行业大模型性能有着非比寻常的意义。两三年里可能看不到成果，但五到十年后就有可能会出现颠覆性的局面。我希望，到那个时候，中国会是做得最好的那个。

asiavikin

军事杂谈

最新文章

闲聊变后掠翼的沉浮

美军F-35开年第一摔，可喜可贺！

美国和欧洲正在研制和实施的5型车载机动反无人机解决方案

Deepseek遭受网络攻击

美军F35A坠毁

蛇年吉祥

日本23式舰载防空导弹获得大笔预算，在03式改进型导弹上强化

首次发布，歼15D着舰山东舰？

（补档）枭龙战斗机下一代引起印度网民关注：模仿土耳其五代机属于想多了

匈牙利首个KF41步战车营即将达到初始作战能力，经历适应性改造

我军特级飞行员拦截台湾侦察机，2万多米的战场，近到能看清敌人，最后却一笑泯恩仇

1361. 红军的panther：二战苏联T-V“豹”式坦克（上篇）

这张图，你看懂了吗？

比较强五改进型和A4“天鹰”

神奇的Fantan——强五在巴基斯坦

印度SANJAY战场监视系统服役，可严控边境监控邻国纵深

加沙近况：抵抗力量释放以色列女兵

中国公开某型战略预警相控阵雷达

部署20万“维和部队”到乌克兰？特朗普改口：100天内解决俄乌冲突，能做得到吗？

F-22战斗机将获得分布式红外搜索跟踪系统，安装方式仍有悬念

新年之际台军飞机入侵缅甸，遭缅军拦截并被击落，6人死亡，暴露了台湾这一神秘任务

你要好自为之，懂吗？

瑕瑜互见，简评054B服役

又一起针对中国人的恐袭，3人遇难！ISKP恐怖主义渗透中亚，对我们的威胁有多大？

中国两架战机前出西太，御用摄影师为何没有拍到？

盘点2024年俄罗斯军用飞机产量！稳中有升却影响了出口市场

从苏-27油耗数据看战斗机真实面目

中国六代机又开始试飞了？美国六代机项目NGAD进展如何？已落后中国至少5年时间？

马斯克举起右臂是纳粹礼？和希特勒高度同步可能是误解

英国台风战斗机挂载的蓝盾瞄准吊舱意外坠落，损失接近百万美元

1357. 撕裂弗勒尔村的恶魔：1916年9月重装分队D连与英国第15军的协同攻势（上篇）

“死而复生”

排水量5000吨！中国054B护卫舰首舰正式服役，官宣的“海军转型发展”是何深意？

谈一下在台湾西北部的登陆作战

印度阅兵式首次展示普拉雷导弹发射车，采用国产底盘

浅谈1945年东线德军装甲战斗车辆损失（下）

054B首舰服役！

这位越来越没谱了

一口气就买6艘！中国F15A型护卫舰，收获阿尔及利亚高度认可：比俄制舰船好太多！

美国为何又用华裔代表问中国：俄乌的生意不是美国做最大吗？

中国发布全球最强电子战武器设计软件，比美国快15倍！

美军濒海战斗舰获得新武器，用垂发地狱火导弹打击无人机

安卡-3隐身性能到底如何？

歼-20总师杨伟被免职引发网友关注

重塑战场风暴：中国11式122毫米火箭炮的革新之旅

阿联酋FALAJ3近海巡逻舰首次下水，与新加坡合作加装垂发

浅谈1945年东线德军装甲战斗车辆损失（下）

1355. 太平洋坦克战(33)：日军的履带式炮兵牵引车②

性能全面超越中国055！美军新一代驱逐舰DDGX进展如何？首舰至少还要等十多年？

一幅图，看懂2030年中国海军实力

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉