DeepSeek团队核心成员:4人北大2人清华,创始人为“80后”,毕业于浙大…
学术
2025-01-30 17:43
北京
来源:Top大学来了综合自“中央广电总台中国之声、中国青年报客户端(作者:袁野)、橙柿互动·都市快报、红星新闻等”
近日,受中国人工智能初创公司——深度求索公司(DeepSeek)冲击,美国人工智能主题股票遭抛售,美国芯片巨头英伟达(NVIDIA)股价历史性暴跌,纳斯达克综合指数大幅下跌。2024年底,DeepSeek发布了新一代大语言模型V3,并宣布开源。测试结果显示,该模型在多项评测中表现优于主流开源模型,且具有成本优势。本月,DeepSeek在世界经济论坛2025年年会开幕当天发布了最新开源模型R1,再次引发全球关注。据介绍,R1模型在技术上实现了重要突破——用纯深度学习方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩OpenAI的o1模型正式版,且训练成本仅为560万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。DeepSeek是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。与OpenAI开发的ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。2025年1月20日下午,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。在此次座谈会上,共有9人先后发言,其中就有深度求索(DeepSeek)创始人梁文锋。据报道,梁文锋是位80后,来自广东湛江吴川。2002年,他以吴川市第一中学“高考第一”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。2023年5月,38岁的梁文锋宣布做通用人工智能(AGI)。7月,他正式创办杭州深度求索人工智能基础技术研究有限公司,就是DeepSeek公司,专注于AI大模型的研究和开发,公司设在杭州。有同事评价梁文锋:完全不像一个老板,而更像一个极客。因为作为老板,他本人每天都在写代码、跑代码,学习能力惊人。创始人梁文锋毕业于浙江大学信息与电子工程学专业,为硕士学历。朱琪豪是北大计算机学院软件研究所 2024 届博士。赵成钢本科就读于清华,曾三次获得世界大学生超算竞赛冠军。罗福莉本科毕业于北京师范大学,硕士就读于北京大学。