除夕,DeepSeek又放大招

政务   2025-01-29 09:00   贵州  

“重创”美股后,
DeepSeek除夕又“放大招”

刚刚暴击完美股,国产大模型公司深度求索(DeepSeek)又抛出新模型。

1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

Github社区信息显示,Janus-Pro是去年发布的Janus的高级版本,可显著提高多模式理解和视觉生成。相比此前的Janus,Janus-Pro优化的训练策略、扩展的训练数据和扩展到更大的模型尺寸。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。



值得注意的是,就在27日深夜,DeepSeek仅凭一己之力就掀翻了美国科技股。

截至美股1月27日收盘,道指涨0.65%,标普500指数跌1.46%,纳指跌3.07%。英伟达暴跌16.97%,单日市值蒸发5890亿美元,创史上最大单日个股市值蒸发纪录。英伟达的暴跌也使得创始人黄仁勋的身家大幅缩水210亿美元。

此外,甲骨文下跌13.78%,超微电脑下跌12.49%,芯片制造商博通下跌17.4%,台积电跌13%。《华尔街日报》称,道琼斯市场数据显示,周一的“市场大屠杀”总共使股市市值蒸发了约1万亿美元。



消息面上,1月27日早间,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。DeepSeek系量化巨头幻方量化旗下大模型公司,1月20日,该公司正式发布推理大模型DeepSeek-R1。

推出后不久,R1就凭借其开源的性质、大幅下降的售价和训练成本获得了广泛关注。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。

更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成。

市场人士称,DeepSeek的R1大型语言模型或引发行业重估大模型成本。华尔街开始考虑科技行业巨头对AI基础设施的巨额投资以及对英伟达芯片的需求是否合理。

值得注意的是,近日DeepSeek需求火爆,AI服务在24小时内经历了多次宕机。服务状态页面显示,“近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。”




DeepSeek创始人梁文锋:

过年要躲起来


近日,DeepSeek在国内外媒体刷屏,也引发全球科技圈、投资圈的关注。与DeepSeek同样备受关注的,还有它的创始人梁文锋。
1月26日,其多年好友陈先生告诉南都记者,读书的时候,梁文锋就经常做课题实验,“很有前瞻的眼光”。


南都记者注意到,深度求索(DeepSeek)成立于2023年5月,是一家大模型创业公司。
成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder
2024年5月,该公司发布开源模型DeepSeek V2将推理成本降低近百倍,一跃成名。
同年12月26日,全新系列模型DeepSeek-V3发布,在大模型主流榜单中位居前列。
今年1月20日,DeepSeek发布了性能对标OpenAI-o1正式版的新模型——DeepSeek-R1,并同步开源模型权重。
这些成果在国内外AI圈掀起讨论热潮,被称作“来自东方的神秘力量”。
Semi Analysis首席分析师认为,DeepSeek V2论文“可能是年内最好的一篇”。OpenAI前员工Andrew Carr认为论文“充满惊人智慧”,并将其训练设置应用于自己的模型。而Anthropic联合创始人Jack Clark认为,DeepSeek“雇佣了一批高深莫测的奇才”。
与DeepSeek同样备受关注的,还有它的创始人梁文锋。
南都记者获悉,梁文锋是位80后,来自广东湛江吴川。2002年,他以吴川市第一中学“高考状元”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。
26日,南都记者联系上梁文锋的高中同学兼好友陈先生。
陈先生表示,读书的时候,梁文锋就经常做课题实验,学习刻苦,也热爱足球。大学时期,梁文锋读的AI工程专业前景并不明朗,但他很有前瞻的眼光。“完全是白手起家,创业以来还做过全自动绣花机等产品,不断探索总结溯源。”
陈先生还表示,“梁文锋的衣着打扮和为人处世都非常低调,淳朴有善心,此前以个人名义捐了很多钱。看到他火了很开心,前几天我给他发信息祝贺,他还说会回吴川过年,但今年要躲起来。
同日,“DeepSeek短暂闪崩”等话题备受热议。
南都记者查询获悉,DeepSeek-R1于当天下午短暂出现网页/API不可用的情况,官方经查明后于14时39分修复。
1月27日,DeepSeek登顶苹果美区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一




   ●8个专属表情包!贵州改革给您拜年啦
   ●贵州名家唱响央视蛇年春晚
   ●新闻早班车(1月29日)

来源:澎湃新闻、南方都市报

统筹:张烈烈

编审:代芹涟

微编:杨   阳

“贵州改革”微信2025年第405(总第9310期)

2025年1月29日

贵州改革
上连天线,传递中央、省委改革声音;下接地气,关注百姓、粉丝民生实事。
 最新文章