![]()
![]()
![]()
这半个月,科技界最火的关键词之一,必有“DeepSeek”一席之地。1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。1月26日,《黑神话:悟空》制作人冯骥评价DeepSeek:“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”![]()
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。真正让DeepSeek火出圈的是2024年12月26日,这家公司宣布上线并同步开源的 DeepSeek-V3模型。它以1/11的算力、仅2000个GPU芯片训练出性能超越GPT-4o的大模型。其总训练成本只有557.6万美元,而GPT-4o的约为1亿美元,使用25000个GPU芯片。双方的成本至少是10倍的差距。在性能上,DeepSeek-V3在数学、代码能力和中文知识问答方面还超过了ChatGPT-4o。DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”不到一个月之后,2025年1月20日,DeepSeek正式开源R1推理模型。据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。英伟达高级研究科学家Jim Fan在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”![]()
有人评价,DeepSeek的横空出世,让美国科技界第一次感到恐惧。
从表层看,美国AI巨头嗅到了危机,不是因为技术被超越,而是实现目标的技术路径变了,新创企业有了更多选择。就像燃油车时代比拼的是发动机,电动车时代比拼的是电池管理技术。DeepSeek证明了硅谷堆硬件堆数据的路线不是唯一选择,高效用好现有资源同样能打。
DeepSeek省钱省力的R1模型发布时,刚好是OpenAI、软银、英伟达等科技巨头宣布5000亿美元算力基建——星际之门计划的时间段,放在这个背景下对比来看,美国AI巨头的刺痛感就更强烈了。
几天前,DeepSeek新模型一发布,美股的AI板块直接跌崩——英伟达暴跌13%,台积电暴跌11%,ASML暴跌7%……算下来,一夜之间美股蒸发上万亿美元。有人直言,这比索罗斯当年狙击英镑更震撼。要知道,股市是美国经济和金融体系的主要蓄水池,高科技股更是美股的顶梁柱。如今一家中国小公司就让美股的支柱受到如此冲击,这是美国商界和政界不可承受之重。
所以我们看到,前脚美国总统特朗普还称“DeepSeek是很积极的技术成果”,后脚美国的主流舆论和权力机构就对DeepSeek展开了“全面围剿”:美国国家航空航天局(NASA)发布内部备忘录,以服务器位于美国境外、存在国家安全和隐私风险为由,禁止员工使用DeepSeek AI,禁止系统访问该平台。美国海军向全体成员发邮件,警告DeepSeek来源和使用存在“潜在安全和道德问题”,禁止军方人员使用。美国众议院首席行政事务官通知国会办公室,禁止DeepSeek用于官方用途。白宫人工智能和加密货币事务负责人甚至声称“有大量证据表明,DeepSeek将OpenAI的知识,通过蒸馏提炼到DeepSeek中”……资料显示,自2025年1月3日起,DeepSeek就遭受了大规模、持续性的网络攻击,攻击手段复杂且不断升级。攻击者试图通过网络攻击窃取DeepSeek的核心算法、用户数据及商业机密。这个攻击有多猛呢?例如,1月30日凌晨,奇安信XLab实验室监测发现,针对DeepSeek线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。从流量上看,每秒高达2.3亿次恶意请求:相当于全中国4.5亿台智能手机同时按下刷新键,超过双十一峰值流量的217倍,每毫秒就有23万次攻击冲向服务器。而且,随着僵尸网络的加入,标志“职业打手”已经下场,说明DeepSeek面对的攻击方式一直在持续进化和复杂化,防御难度不断增加。欣慰的是,面对来自西方数字霸权的攻击,中国科技圈出奇地团结,纷纷加入 DeepSeek 保卫战。![]()
据华为云官方微信公众号2月1日消息,DeepSeek-R1开源后引发全球用户和开发者关注。经过硅基流动和华为云团队连日攻坚,现在,双方联合首发并上线基于华为云昇腾云服务的DeepSeekR1/V3推理服务。- 得益于自研推理加速引擎加持,硅基流动和华为云昇腾云服务支持部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。
- 提供稳定的、生产级服务能力,让模型能够在⼤规模生产环境中稳定运行,并满足业务商⽤部署需求。华为云昇腾云服务可以提供澎湃、弹性、充足的算力。
DeepSeek-R1:https://r1.siliconflow.cnDeepSeek-V3:https://v3.siliconflow.cn![]()
- 精准提问技巧:"请用300字解释量子计算原理,要求通俗易懂并举例" - 新媒体文案:输入"帮写小红书风格的防晒霜文案,带3个emoji" - 专业文档:尝试"生成项目可行性报告大纲,包含风险评估模块" - 代码生成:"用Python写一个自动整理桌面文件的脚本" - 上传PDF文档后提问:"总结这篇论文的创新点" - 输入时混用中英文:"解释什么是metaverse并举例中文应用场景" - 添加格式指令:"用分点方式列出5个时间管理方法,每个方法包含实施步骤" - 制作表格:"整理北京十大景点信息,包含门票价格和推荐指数" - 专业咨询:"作为心理咨询师,如何缓解职场焦虑?" - 创意激发:"假如你是苏轼,会怎样描写现代都市?" - 数据分析:"2023年新能源汽车销量前三的品牌是哪些?" ✔ 优化版:"如何撰写科技类公众号开头段?需要设置悬念吸引中年读者" - 重要内容建议模糊处理:"某快消品牌"替代具体名称DeepSeek的出现,不仅仅是一个技术的进步,也让每个人都能成为AI的使用者和创造者。在未来,随着技术的不断发展,DeepSeek或许会给我们带来更多惊喜。本文参考资料:中国青年报、华为云官方微信公众号、DeepSeek
今日推荐图书《 大模型应用开发——深入理解30个可执行案例设计 》。大模型技术是目前人工智能领域的重要发展方向之一,具有广阔的应用前景和巨大的发展潜力。本 书结合当前高等院校创新实践课程,基于大模型应用程序的开发方法,给出可执行实战案例。大模型技术 主要开发方向为人机聊天、自动生成代码、旅游图鉴等,本书案例主要包括系统架构、系统流程、开发环境、 开发工具、系统实现、功能测试等内容。本书中所述案例多样化,可满足不同层次的人员需求; 同时,本书附赠视频讲解、工程文件、拓展知识、 插图素材、程序代码,供读者自我学习和自我提高使用。本书可作为大学信息与通信工程及相关专业的本科生教材,也可作为从事物联网、创新开发和设计的 专业技术人员的参考用书。《 大模型应用开发——深入理解30个可执行案例设计 》【书评征稿】如果你已经读过这本书,欢迎将你的感受写成书评(1000-2000字)以word形式发送到清华社投稿邮箱 xmt@tup.tsinghua.edu.cn,入选者会以邮件形式及时通知并联系支付相应稿费。
![]()
#进入官方视频号查看更多#
找到更多志同道合的人
分享、点赞与在看,至少帮我拥有一个吧~