近日,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,甚至被认为是大模型行业的最大“黑马”,在外网,DeepSeek被不少人称为“神秘的东方力量”。
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
而就在1月20日,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议,来自广东湛江吴川的AI初创公司深度求索(DeepSeek)创始人梁文锋出席并发言。
南都记者注意到,深度求索(DeepSeek)成立于2023年5月,是一家大模型创业公司。
成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder。
2024年5月,该公司发布开源模型DeepSeek V2,将推理成本降低近百倍,一跃成名。
同年12月26日,全新系列模型DeepSeek-V3发布,在大模型主流榜单中位居前列。
今年1月20日,DeepSeek发布了性能对标OpenAI-o1正式版的新模型——DeepSeek-R1,并同步开源模型权重。
这些成果在国内外AI圈掀起讨论热潮,被称作“来自东方的神秘力量”。
南都记者获悉,DeepSeek创始人梁文锋是位80后,来自广东湛江吴川。2002年,他以吴川市第一中学“高考状元”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。
26日,南都记者联系上梁文锋的高中同学兼好友陈先生。
陈先生表示,读书的时候,梁文锋就经常做课题实验,学习刻苦,也热爱足球。大学时期,梁文锋读的AI工程专业前景并不明朗,但他很有前瞻的眼光。“完全是白手起家,创业以来还做过全自动绣花机等产品,不断探索总结溯源。”
陈先生还表示,“梁文锋的衣着打扮和为人处世都非常低调,淳朴有善心,此前以个人名义捐了很多钱。看到他火了很开心,前几天我给他发信息祝贺,他还说会回吴川过年,但今年要躲起来。”
此前,OpenAI前政策主管、Anthropic联合创始人Jack Clark认为DeepSeek雇用了“一批高深莫测的奇才”,对此,梁文峰在接受自媒体采访时曾透露过,并没有什么高深莫测的奇才,都是来自Top高校的毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。
从目前已有的媒体公开报道中可以看出,DeepSeek团队最大的特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下。不到140人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。
中国新闻社(CNS1952)综合自南方都市报、中新社此前报道等
编辑:代硕
审校:魏园
是否计划接回在美的非法中国移民?外交部回应
外交部:武汉实验室泄漏极不可能,美应停止抹黑推责!
安徽合肥突发地震!