一夜出圈的DeepSeek到底厉害在哪儿

教育   2025-01-31 09:45   河北  

不过随后,不少用户表示,系统出现了短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。

DeepSeek厉害在哪儿

英伟达等美股科技公司市值暴跌

资本市场迅速做出反应:英伟达公司股票27日以每股124.80美元开盘,大幅下跌12.49%,此后跌幅持续扩大,收盘时下跌16.97%,市值蒸发约5900亿美元,创下美国上市公司单日市值损失的纪录。此外,博通公司股价盘中跌幅一度接近20%,收盘时下跌17.4%。截至收盘,纳斯达克综合指数下跌612.47点,收于19341.83点,跌幅为3.07%。其他主要股指中,科技板块同样领跌。

对此,英伟达公开回应称:“DeepSeek是一项卓越的人工智能进展,也是测试时扩展的绝佳范例。DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力,创建新模型。”

“神秘的东方力量”从未对外融资

对于DeepSeek爆火,85后创始人梁文锋回应:中国AI不可能永远跟随。

DeepSeek是杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月。公司由知名量化资管巨头幻方量化创立。公司创始人梁文锋,本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年,进军通用人工智能领域。

公开信息显示,该团队“小而精”,只有100多人,与之相比,OpenAI有1200名研究人员。公司的工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,年纪也多在35岁以下。梁文锋曾表示,“招聘看能力,而不是看经验。我们的核心技术岗位,基本以应届和毕业一两年的人为主。”

值得注意的是,目前该公司从未对外融资。“我们跟了这家公司一年多了,一直想要进入,但是对方根本没有融资诉求”,国内一家大型资本机构负责人告诉北青报记者,“他们公司此前是做量化的,资金实力雄厚。”梁文锋也曾公开表示,“短期内没有融资计划”,并认为当下面临的问题“从来不是钱,而是高端芯片(短缺)”。

在被称为“神秘的东方力量”的DeepSeek火了之后,据称,Meta内部甚至成立了专门的研究小组,试图剖析DeepSeek的技术细节,以改进其Llama系列模型,并且新年计划中预算4000亿起步投资AI,年底AI算力将达130万卡。OpenAI也紧急透露新模型o3-mini即将免费上线ChatGPT的消息。

业内人士表示,关于AI大模型竞争仍然激烈,AI应用的创新和提升空间仍然很大,尤其是在面临算力限制的现实情况下,未来国内外的大模型市场格局还将不断变化与重塑。

内容来源自网络,如有侵权请联系删除

线话英语
英语干货、“每日一句”,结合时事新闻,每日推送英语知识,助您轻松学习英语;中外教一对一体验,利用碎片时间,拥有流利口语
 最新文章