1月28日消息,DeepSeek于服务状态页面公告称:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录。28日凌晨,国内火爆的AI大模型公司深度求索(DeepSeek)称遭受大规模恶意攻击!据悉,DeepSeek旗下AI(人工智能)服务在24小时内经历了多次宕机。1月20日,DeepSeek推出了AI模型R1,这是一款为解决复杂问题而设计的专用模型。在海外出圈之后,DeepSeek的服务需求激增。DeepSeek表示,最新的AI模型可以与OpenAI的ChatGPT媲美,且开发成本远低于竞争产品。
这次更新引发了美国和欧洲科技股市值蒸发超过1万亿美元的暴跌,投资者质疑美国一些大公司虚高的估值。当地时间1月27日,美股三大股指低开,道指跌0.8%,标普500指数跌2.2%,纳指跌3.6%。DeepSeek引发芯片股估值担忧,半导体股大幅下挫,英伟达跌超15%。当地时间1月27日, DeepSeek团队正式发布两款多模态框架——Janus-Pro 和 JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,通过解耦视觉编码的方式,极大提升了模型在不同任务中的适配性与性能。JanusFlow是一款通过生成流(Rectified Flow)与自回归语言模型融合实现统一的框架。它不仅在理解任务中表现优异,还能生成高质量图像,展现了框架设计的极简与强大。Meta创始人兼CEO马克·扎克伯格近日在一档播客节目中表示,DeepSeek的大模型非常先进,中国正在全力冲刺,美国科技行业虽然暂时领先,但两者差距很小。另据媒体报道,Meta已经成立了四个专门研究小组来研究量DeepSeek的工作原理,并基于此来改进旗下大模型Llama。对于下载榜排名的变化,ChatGPT回复:DeepSeek如果能够在短时间内超越ChatGPT,可能是在某些方面有独特的优势或者满足了用户的某种需求,比如更高效的搜索、深度信息挖掘或者更符合用户习惯的界面和功能。不过,ChatGPT也表示,它在AI领域已经积累了很强的品牌效应和用户基础,这样的排名变化也许是暂时的,但也说明了市场上竞争激烈,AI应用的创新空间还很大。如果 DeepSeek真能带来一些突破性体验,可能会在长期内对市场格局产生影响。“神秘的东方力量”!
中国AI公司的创造力正技惊四座!最近几天,一家名为深度求索(DeepSeek)的中国公司在欧美AI圈引起了不小的震动,甚至被认为是大模型行业的最大“黑马”。DeepSeek被不少外国人称为“神秘的东方力量”!
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。把开源模型做到全球第一,和公司团队开发大模型“DeepSeek-V3”的科技创业者是来自广东湛江的梁文锋。近日,这名85后还现身新闻联播,以AI初创公司深度求索(DeepSeek)创始人的身份参加了一场国家超高规格座谈会,并现场发言,他发言的照片流传于各类社交平台。梁文锋从小成绩优异,小学六年级时他就通过考试被吴川一中录取,在吴川一中完成了初中、高中学业,一直是学校里的“尖子生”,并在数学学科表现出极大天赋。“他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。”梁文锋的初中班主任容先生表示,初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合,仿佛不需要花很多时间来学习就可以学好每一个学科。2002年,梁文锋17岁,他以吴川一中高考第一名的成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。据悉,在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。2023年,梁文锋创立深度求索品牌DeepSeek。DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。几天前,总部位于中国杭州的DeepSeek发布推理模型R1,在性能逼近OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。据纽约时报报道,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。1月24日,美国消费者新闻与商业频道CNBC发文称,DeepSeek的AI模型“威胁美国在AI领域的主导地位”。同日,华尔街顶级风投A16Z创始人马克·安德森在社交媒体发言称,DeepSeek R1是其见过的最令人惊叹、最令人印象深刻的突破之一,并且是开源的,是给世界的礼物。英伟达资深科学家、AI智能体业务负责人Jim Fan也对其给予了高度评价。另据报道,Meta(前身为 Facebook)员工在美国匿名职场社区teamblind上发帖提到,DeepSeek最近的一系列动作让Meta的生成式AI团队陷入了恐慌,工程师正在疯狂地分析DeepSeek,试图从中复制任何可能的东西。