DeepSeek创始人:梁文锋2002年,考入浙江大学电子信息工程专业。梁文锋本科、研究生都就读于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。2010年获得信息与通信工程硕士学位。2013年,与浙大同学徐进共同创立了杭州雅克比投资管理有限公司。2015年,成立杭州幻方科技有限公司。2016年10月21日,幻方量化推出第一个AI模型,第一份由深度学习生成的交易仓位上线执行,使用GPU进行计算。2017年,幻方量化宣称实现投资策略全面AI化。2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2021年,在梁文锋参与的论文中提到,他们正在部署的萤火二号系统,“配备了1万张A100GPU芯片”,在性能上接近DGX-A100(英伟达推出的人工智能专用超级计算机),但成本降低了一半,同时能耗减少了40%。
2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年,他宣布将正式进军通用人工智能领域,并创办了深度求索DeepSeek,专注于做真正人类级别的人工智能。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。梁文锋为创始人。
2024年5月,DeepSeek发布混合专家语言模型DeepSeek-V2。同年12月,DeepSeek-V3问世,这款性能优越且性价比极高的大语言模型,被硅谷同行誉为“来自东方的神秘力量”。2025年1月20日,梁文锋参加总理座谈会并发言。
DeepSeek核心成员(部分)
- 梁文锋:DeepSeek创始人,毕业于浙江大学,信息与电子工程学硕士。
- 高华佐:北大物理系毕业,为DeepSeek-V2的MLA架构做出了关键创新。
- 曾旺丁:来自北邮,在DeepSeek-V2的MLA架构创新上有重要贡献。
- 邵智宏:清华交互式人工智能(CoAI)课题组博士生,参与了DeepSeek-Math、DeepSeek-Prover、DeepSeek-Coder-v2、DeepSeek-R1等项目。
- 朱琪豪:北大计算机学院软件研究所2024届博士毕业生,主导开发了DeepSeek-Coder-V1。
- 代达劢:2024年博士毕业于北京大学计算机学院计算语言所,参与了从DeepSeek LLM v1到DeepSeek-v3的工作。
- 王炳宣:北大元培学院硕士,加入DeepSeek后参与了从DeepSeek LLM v1开始的一系列重要工作。
- 赵成钢:清华学生,曾三次获得世界大学生超算竞赛冠军,在DeepSeek担任训练、推理基础架构工程师。
- 吴俣:2019年北航博士毕业,领导DeepSeek的后训练团队。
- 郭达雅:中山大学与MSRA联合培养的2023年博士,2024年7月加入DeepSeek,参与数学和代码大模型工作。
- 罗福莉:本科毕业于北京师范大学计算机专业,北京大学计算语言学专业硕士,曾在阿里达摩院工作,2022年加入DeepSeek,参与了DeepSeek-V2的研发工作。