1月27日
DeepSeek登上热搜第一
“来自东方的神秘力量”
又一次震撼海外人士心脏
“这太疯狂了”
“大模型圈的大黑马”
“硅谷震惊了”
“来自中国的学霸级AI”
27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。
同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
冯骥:“震撼的突破”
1月26日,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。
冯骥表示:“希望DeepSeek R1会让你对当前最先进的AI祛魅,让AI逐渐变成你生活中的水和电。太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”
DeepSeek是啥?
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。
据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
为什么DeepSeek能出圈?
该模型在多个基准测试中表现优异,甚至超越了部分美国顶尖AI模型。尤其突出的是,它的训练成本很低,算力资源消耗很少,令国外同行在惊呼:“这太疯狂了”。
DeepSeek-R1厉害在哪?记者尝试让这款大模型软件自己用大白话来回答这个问题。它的答案是——
听说DeepSeek的训练方式
不重刷题重推理
所以这家伙特别擅长
“个性化发挥”“不说套话”
新春将至
当然免不了
要给大模型出个必答题
写一段新春祝福
花了6秒,DeepSeek
就写出了新年祝福
再看看思考过程
Deepseek你怕不是个话痨
DeepSeek写的新春祝福
你觉得如何?
一起在评论区聊聊吧~
乙巳蛇年
青春上海专属红包封面
来啦!
沪团团来送“福”
春节氛围感继续拉满~
点击下方一键领取
数量有限,先到先得!
没赶上的小伙伴们
也不用着急
青春上海将会在推送中
随机掉落红包封面哦
祝大家蛇年顺遂
所愿皆所得
未来皆坦途