“乌鸦”梁文峰,掀了老美的桌子!他们下场护航,稳了。

文摘   2025-02-01 10:41   天津  
“出价本来就是各凭本事,哪有现在叫我收手的?你们洪兴能出,难道我们东星就不能出价吗?”
“做小弟的都拿刀子捅大哥了,出来混的,没有一个讲义气的。你那套过时了,走,没什么好看的,吃饭去!”
全球AI江湖,刀光剑影,瞬息万变。
梁文峰再现古惑仔“乌鸦”名场面,带着DeepSeek掀了美国AI的桌子。
最新:意大利人下架了DeepSeek,结果这两天,英伟达,AMD,亚马逊,微软全部接入了DeepSeek。意大利又一次站错了队。


AI江湖,DeepSeek 掀桌登场

他就像一个闯入牌局的不速之客,在老美的地盘上,直接掀翻了牌桌,让整个 AI 世界为之震动。他不仅打破了 AI 领域原有的格局,也让人们对未来的 AI 发展充满了更多的想象和期待。

他就是梁文峰和他的DeepSeek。

那么,DeepSeek 究竟是如何做到的?它的出现又会给 AI 领域带来怎样的变革呢?今天,这篇文章让我们一起走进 DeepSeek 的世界,一探究竟。

DeepSeek成长全录:从默默无闻到震撼全球

(一)诞生:量化大佬跨界 AI,DeepSeek 横空出世

在 AI 领域崭露头角之前,梁文峰已是量化投资领域的传奇人物。

他 17 岁考入浙江大学,30 岁创办幻方量化,36 岁时便管理着千亿私募。

在量化投资领域取得巨大成功后,梁文峰敏锐地察觉到了通用人工智能领域的无限潜力。就像当年他毅然投身量化投资一样,这一次,他决定再次跨界,进军 AI 领域,创立了 DeepSeek。

梁文峰在接受采访时曾表示:“我们的初衷很简单,就是希望能够在通用人工智能领域做出真正有价值的东西,为全球的科技发展贡献一份力量。” 

带着这样的信念,他组建了一支由来自中国顶尖大学的年轻毕业生和博士生组成的核心团队。

这个团队虽然规模不大,但却充满了创新活力和无限潜力。他们没有被传统的思维模式所束缚,而是以一种全新的视角和方式,探索着 AI 领域的未知世界。

小知识:什么是量化交易?

量化交易是指以先进的数学模型替代人为的主观判断,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种 “大概率” 事件以制定策略,极大地减少了投资者情绪波动的影响,避免在市场极度狂热或悲观的情况下作出非理性的投资决策。

(二)发展:价格战打响,技术一路狂飙

2024 年 5 月,DeepSeek 发布了 V2 模型,在 AI 行业掀起了一场惊涛骇浪。V2 模型以其史无前例的性价比,瞬间打破了市场原有的价格体系,引发了激烈的价格战。

“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。” 梁文峰在谈及 V2 模型引发的价格战时说道 。

他表示,他们只是按照自己的步调做事,核算成本定价,原则是不贴钱,也不赚取暴利。没想到价格会让大家这么敏感,更没想到会引发如此大规模的价格竞争。

随着 V2 模型的成功,DeepSeek 并没有停下前进的脚步。

2024 年 12 月,他们推出了 DeepSeek-V3,进一步提升了模型的性能和表现。

紧接着,2025 年 1 月 20 日,DeepSeek 又相继发布了 DeepSeek-R1、DeepSeek-R1-Zero 以及参数规模在 15 亿到 700 亿之间的 DeepSeek-R1-Distill 模型。

这些模型在技术上不断创新,采用了强化学习等先进技术,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,却有着更低的成本,在仅有极少标注数据的情况下,极大提升了模型推理能力。

(三)爆火:登顶下载榜,全球为之侧目

2025 年 1 月 27 日,是 DeepSeek 发展历程中具有里程碑意义的一天。

这一天,DeepSeek 应用登顶苹果美国地区应用商店免费 APP 下载排行榜,在美区下载榜上超越了 ChatGPT,成为了全球瞩目的焦点。

同时,在苹果中国区应用商店免费榜中,DeepSeek 也成功登顶,成为中国区第一。这一成绩的取得,让全世界都看到了 DeepSeek 的实力和潜力。

“这种惊喜和第一次用 ChatGPT3.5 差不多,甚至感觉更震撼。ChatGPT 写套路性很强的应用文很好用,但一旦涉及高语境,调侃,讽刺,就有浓浓的 AI 味,没有幽默感。DeepSeek 对高语境内容和中文网络上的梗都能理解明白,内容基本达到了脱口秀文本的水平。”  IT 从业者刘鸿博在接受采访时这样评价 DeepSeek。

 不仅如此,DeepSeek 的爆火还引发了美国股市科技板块的剧烈震荡。

美国芯片巨头英伟达当日股价暴跌约 17%,博通公司股价下跌 17%,超威半导体公司股价下跌 6%,微软股价下跌 2%。人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌 21%,Vistra 的股价下跌 29%。

市场分析认为,核心原因是 DeepSeek 的最新突破,动摇了美国科技行业在 AI 领域的 “无敌” 地位。

最新进展:美国调查,全球热议

随着 DeepSeek 的迅速崛起,它也引来了美国政府的关注,一场针对 DeepSeek 的安全调查正在展开。据外媒报道,1 月 28 日,美国多名官员回应 DeepSeek 对美国的影响,表示 DeepSeek 是 “偷窃”,正对其影响开展国家安全调查。

美国海军向美国消费者新闻与商业频道证实,已向相关人员发出邮件示警,提醒 “不得以任何形式下载、安装或使用 DeepSeek 模型” 。

白宫人工智能和加密货币事务负责人大卫・萨克斯受访时表示:“有大量证据表明,DeepSeek 将 OpenAI 的知识,通过蒸馏提炼到 DeepSeek 中,我认为 OpenAI 对此并不高兴。”

美国政府对 DeepSeek 展开调查,其背后的原因值得我们深思。

从市场竞争角度来看,DeepSeek 的出现,打破了美国在 AI 领域的垄断地位,对 OpenAI 和谷歌等美国人工智能领先者的市场主导地位造成了威胁。其低成本、高性能的模型,让美国的大模型公司感受到了前所未有的压力。

从技术封锁角度来看,美国一直试图通过限制芯片出口等手段,遏制中国在人工智能领域的发展。

然而,DeepSeek 却在这种困境下,通过创新的技术路线,实现了突破,这无疑让美国政府感到了挫败和不安。

面对美国的调查和指责,DeepSeek 团队表示,他们一直致力于技术创新和自主研发,所有的技术和模型都是团队成员辛勤努力的结果,不存在所谓的 “偷窃” 行为。

梁文峰在接受采访时,坚定地说:“我们有自己的技术研发体系,每一个代码、每一个算法,都是我们团队智慧的结晶。我们尊重知识产权,也希望得到他人的尊重。”

与此同时,DeepSeek 的成功也引发了全球各界的广泛关注和讨论。许多媒体纷纷报道了 DeepSeek 的崛起,称其为 AI 领域的 “黑马”。

《纽约时报》发表评论文章称:“DeepSeek 的出现,打破了人们对 AI 领域的传统认知。它以一种全新的方式,重新定义了 AI 的发展路径。” 

专家们也对 DeepSeek 的技术和发展前景给予了高度评价。人工智能专家李开复表示:“DeepSeek 的技术突破,不仅为中国的 AI 发展注入了新的活力,也为全球的 AI 研究提供了新的思路和方向。”

在社交媒体上,网友们也对 DeepSeek 展开了热烈的讨论。有的网友表示:“DeepSeek 的成功,让我们看到了中国科技的实力。它是我们的骄傲!” 。

梁文峰的 AI 观:创新是第一要义

在接受采访时,梁文峰就 DeepSeek 的发展理念、技术创新以及未来规划等方面分享了诸多深刻见解。他始终强调创新是 DeepSeek 发展的第一性原则,与其他致力于快速商业化的中国 AI 公司不同,DeepSeek 专注于基础的 AGI 研究和创新 。

在他看来,中国不能仅仅作为全球人工智能发展的 “搭便车者”,而应转变为积极的 “贡献者”。“创新不完全是商业驱动的,还需要好奇心和创造欲。我们希望探索人工智能的更多可能性,为全球的科技进步贡献独特的价值。” 梁文峰说道。

谈到 DeepSeek 采用的新型 MLA(多头潜在注意力机制)架构时,梁文峰表示,这是团队在技术上的一次大胆创新。这种架构把显存占用降到了过去最常用的 MHA 架构的 5%-13%,实现了成本的大幅降低,其推理成本仅为 Llama 370B 的 1/7、GPT-4 Turbo 的 1/70 。

“我们并不是为了挑起价格战,只是希望找到一种更高效、更经济的技术方案,让更多的人能够享受到人工智能带来的便利。” 梁文峰解释道。这种创新架构也将继续应用于后续的模型研发中,不断提升 DeepSeek 模型的性能和竞争力。

在公司文化和人才战略方面,梁文峰认为,DeepSeek 保持着一个完全自下而上的组织结构至关重要。

“我们为研究人员提供无限的计算资源,让他们能够自由地探索和尝试新的想法。在招聘人才时,我们优先看重的是创造热情而不是证书,我们的突破性创新大多来自年轻的本土人才,他们充满活力和创造力,为公司的发展注入了新的动力。” 

梁文峰还特别强调了开源对于 DeepSeek 以及整个 AI 行业的重要性。

尽管当前行业开始趋向于闭源模型,但 DeepSeek 仍坚定不移地致力于开源。“我们认为开源对于建立一个强大的技术生态系统至关重要。在颠覆性技术面前,闭源形成的护城河是短暂的,我们的真正价值在于建立一个具备创新能力的组织。通过开源,我们可以与全球的开发者和研究人员共享技术成果,共同推动人工智能技术的发展。” 

DeepSeek 团队:年轻力量,创造无限可能

DeepSeek 之所以能在短时间内取得如此辉煌的成就,离不开其背后那支充满活力和创造力的团队。

这支团队规模不大,员工人数不到 140 人 ,仅是 OpenAI 的十分之一左右。但团队成员的素质却非常高,85% 以上拥有硕士学位,40% 以上有博士学位。

团队成员大多来自北大、清华、中科大等国内顶尖院校,也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。

值得一提的是,团队成员平均年龄约为28岁,90 后占比超 75%,95 后员工占比 50% 以上。他们充满朝气和创新精神,为 DeepSeek 的发展注入了源源不断的动力。

DeepSeek 的团队氛围十分独特,完全是自下而上的管理模式,淡化职级,鼓励自由讨论和创新。

成员们可以依兴趣选择研究方向并自由组队,当有潜力的构想出现时,公司会自上而下调配资源。而且,成员对资源和人员的调动不设上限,不存在层级和跨部门的限制,只要有想法,随时可以灵活调用。

这种自由、开放的工作环境,让团队成员能够充分发挥自己的才能,不断探索和创新。

一位不愿透露姓名的 DeepSeek 员工向媒体透露:“公司管理很扁平化,自由交流的氛围比较好。在这里,大家更像是一个大家庭,为了共同的目标而努力。” 这种独特的团队文化,也吸引了许多优秀人才的加入。他们中有的曾在国内大厂工作,但感觉自己像一颗螺丝钉,无法创造价值,最终选择加入 DeepSeek,在这个充满挑战和机遇的平台上,实现自己的梦想。

未来走势:在绞杀中突围

(一)挑战:外部限制与内部竞争

无耻:

北京时间 2025 年 1 月 31 日消息,DeepSeek(深度求索)近期持续遭受来自海外的大规模恶意攻击,攻击者 IP 地址主要集中在美国。


奇安信监测发现,DeepSeek 近一个月来一直遭受大量海外攻击,1 月 27 日起攻击手段升级,除 DDoS 攻击外,还包括大量密码爆破攻击。

起初攻击者采用 HTTP 代理攻击,随后转向 SSDP、NTP 反射放大攻击,最后升级为模拟正常用户行为的应用层攻击,增加了防御难度。


DeepSeek 当天发布紧急声明,确认遭受多维度 APD 攻击,峰值达到每秒 800 万次,精准锁定核心算法数据库。为持续提供服务,暂时限制了 + 86 手机号以外的注册方式,已注册用户可正常登录。


面对攻击,DeepSeek 迅速响应,第一时间进行 IP 切换,与奇安信紧密合作分析攻击来源和手段。同时,华为、360 等多家企业也参与协助应对攻击。

华为宣布华为昇腾平台全面适配 DeepSeek - V3 系列模型,保证数据安全并实现对英伟达的国产化替代;360 创始人周鸿祎带领团队紧急部署,协助加强防火墙、反病毒系统等多层次防护;红客联盟等也协同多家企业共同作战。


此次攻击可能源于商业竞争、地缘政治等因素。DeepSeek 作为中国高科技企业,产品出色、发展势头强劲,其在 AI 领域的崛起引发部分海外企业不满,也受到一些国家出于地缘政治因素的关注与打压。此外,也不排除部分黑客组织或个人出于炫耀技术等原因发起攻击。


该攻击对 DeepSeek 造成线上服务异常,影响用户正常使用,还可能使投资者对其网络安全能力产生担忧,影响融资和估值。这次事件不仅是对 DeepSeek 的严峻挑战,也是对整个 AI 行业安全防范措施的考验。

DeepSeek 在未来的发展道路上,无疑将面临更多挑战。从外部环境来看,美国的限制措施可能会对其发展产生一定的阻碍。美国政府对 DeepSeek 展开调查,试图通过各种手段限制其发展,这给 DeepSeek 的国际市场拓展带来了不确定性。国际竞争也日益激烈,OpenAI、谷歌等美国人工智能领先者不会轻易放弃自己的市场地位,它们拥有丰富的资源和强大的技术实力,必然会加大研发投入,试图重新夺回市场主导权。

在国内,大模型市场的竞争也异常激烈。随着人工智能技术的快速发展,越来越多的企业和机构纷纷涌入大模型领域,市场竞争日益白热化。文心一言、Kimi、豆包等国内大模型产品也在不断发展和创新,它们在技术、市场份额、用户基础等方面都具有一定的优势,这给 DeepSeek 带来了巨大的竞争压力。在这种激烈的竞争环境下,DeepSeek 需要不断提升自身的技术实力和市场竞争力,才能在市场中占据一席之地。

(二)机遇:技术创新与应用拓展

尽管面临着诸多挑战,但 DeepSeek 也拥有着广阔的发展机遇。在技术创新方面,DeepSeek 一直保持着领先的地位。其独特的技术架构和创新的算法,为其未来的发展奠定了坚实的基础。

未来,DeepSeek 有望在多模态技术、强化学习等领域取得更大的突破,进一步提升模型的性能和应用能力。

随着人工智能技术的不断发展,多模态技术将成为未来的发展趋势。DeepSeek 可以通过将图像、语音、文本等多种信息进行融合,实现更加自然、智能的交互,为用户提供更加丰富、便捷的服务。

在应用拓展方面,DeepSeek 也有着巨大的潜力。随着人工智能技术在各个领域的广泛应用,DeepSeek 可以将其技术应用于更多的行业和场景,如医疗、教育、金融、交通等。在医疗领域,DeepSeek 可以帮助医生进行疾病诊断、药物研发等工作,提高医疗效率和质量;在教育领域,DeepSeek 可以为学生提供个性化的学习方案,帮助学生更好地学习和成长;在金融领域,DeepSeek 可以用于风险评估、投资决策等方面,为金融机构提供更加准确、高效的服务。通过拓展应用场景,DeepSeek 可以进一步扩大市场份额,提升品牌影响力。

此外,DeepSeek 还可以通过与其他企业和机构合作,实现优势互补,共同推动人工智能技术的发展。它可以与高校、科研机构合作,开展产学研合作项目,共同攻克技术难题,培养人工智能人才;也可以与企业合作,将其技术应用于企业的生产和管理中,帮助企业提高效率、降低成本。通过合作,DeepSeek 可以整合各方资源,实现互利共赢,为自身的发展创造更多的机会。

DeepSeek 的未来充满了挑战与机遇。在挑战面前,它需要不断创新和突破,提升自身的技术实力和市场竞争力;在机遇面前,它要抓住时机,积极拓展应用场景,加强合作,实现更大的发展。相信在团队的努力下,DeepSeek 一定能够在人工智能领域取得更加辉煌的成就,为全球的科技发展做出更大的贡献。

传奇,未完待续

从诞生时的默默无闻到如今的全球瞩目,DeepSeek 的发展历程充满了传奇色彩。它以创新为驱动,凭借独特的技术架构和充满活力的团队,在 AI 领域掀起了一场风暴。尽管面临着美国的调查和国际国内的激烈竞争,但 DeepSeek 的未来依然充满希望。

我们期待 DeepSeek 能够在技术创新的道路上继续前行,不断突破自我,为全球的 AI 发展带来更多的惊喜。

也希望广大读者能够持续关注 DeepSeek 的动态,关注 AI 行业的发展,共同见证这个充满变革和机遇的时代。相信在不久的将来,DeepSeek 必将在 AI 的历史长河中留下更加浓墨重彩的一笔 。

这篇先这样!

甄优东西
生活本该美好
 最新文章