直新闻是深圳卫视全媒体新闻品牌
由《直播港澳台》团队出品
更多分析请下载直新闻APP
参与评论请在新浪微博@直新闻
这两天,中国人工智能公司深度求索(DeepSeek)发布的大模型DeepSeek-R1震动业界,该模型使用更低的成本和更小的算力规模,实现了足以匹敌美国顶尖AI模型的效果。1月27日,DeepSeek应用登顶苹果中国地区应用商店免费App下载排行榜。而截至北京时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT。在24小时前,DeepSeek甚至都没有挤进该榜的前五,这足见该应用如“火箭”般的蹿升速度。而国产应用同时“霸榜”中美两区的苹果应用商店,更是史无前例的。DeepSeek因此被不少外国人称为“东方神秘力量”。
27日11点左右,DeepSeek官网一度显示“DeepSeek网页/API不可用”,截至发稿,功能已恢复。此前一天,DeepSeek也曾出现短暂宕机的情况。DeepSeek回应称,相关问题可能和服务维护、请求限制等因素有关。
除了C端用户的喜爱,DeepSeek也持续引发行业内的高度重视。1月25日,超微半导体(AMD)在其社交账号上宣布,已将DeepSeek-V3模型集成到AMD Instinct MI300X GPU上,此举或重塑全球AI芯片竞争格局。
微软CEO纳德拉、Meta工程师匿名论坛帖均提到,DeepSeek的低成本高效率模式迫使美国企业重新评估研发策略。脸书母公司Meta便被曝正“争分夺秒地逆向工程”其技术。这可能加速美国企业从闭源转向更开放的合作模式。
据美国Information网站27日的报道,Meta成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型DeepSeek的工作原理,并基于此来改进旗下大模型Llama。其中两个小组正在试图了解幻方量化如何降低训练和运行DeepSeek的成本;第三个研究小组则正在研究幻方量化可能使用了哪些数据来训练其模型;第四个小组正在考虑基于DeepSeek模型属性重构Meta模型的新技术。
据美国《华尔街日报》当地时间1月26日报道,DeepSeek-R1的出色表现已经给美国科技行业留下深刻印象,从业者纷纷称赞深度求索的工作取得了重大突破。OpenAI公司前高管扎克·卡斯(Zack Kass)直言,美国试图通过制裁限制中国的AI发展,但资源的限制反而激发了中国科研人员的创造力。
DeepSeek丨深度求索官网
数字新闻杂志The Wire China发文称,DeepSeek-R1的发布将迫使怀疑论者重新评估中国的技术发展。深度求索对开源承诺的坚持也与OpenAI的专有策略形成鲜明对比,深度求索允许全球企业和开发者共同开发和改进技术,OpenAI则限制对其系统的访问以维护竞争优势。该杂志指出,美国决策者应该反思,通过设置障碍来确保领先地位的方法是否还行得通。
那么,“深度求索”公司及其产品DeepSeek究竟是什么来头?创造这款撼动全球AI业界应用的是一支怎样的团队?其带头人成为总理的“座上宾”,又展现了中国从国家层面对于AI产业怎样的重视程度?共同回顾直新闻早前的报道《“85后”广东小伙,缘何成为李强总理“座上宾”?》(点击链接查看全文)。