DeepSeek创始人梁文锋火了,厉害了!

文摘   2025-01-29 09:00   内蒙古  

对于中国人来说,蛇年最重要的事情,那就是DeepSeek在世界上发布了。一发而不可收拾,在全球,尤其是在美国互联网界以及芯片制造业上,产生了核弹式爆炸影响,让世界刮目相看。对于普通人来说,高科技也许我们就是文盲,但从互联网上专业人士的讲述,感觉到这就是震惊世界的大事情。起码是在被卡脖子和科技的小院高墙下,有了突飞猛进的突围和跨越。了不起,确实是牛了许多,神女应无恙,当今世界殊!

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。在硅谷,DeepSeek很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。2024年底,DeepSeek发布了新一代大语言模型V3,同时宣布开源。测试结果显示,它的多项评测成绩超越了一些主流开源模型,并且还具有成本优势。专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,开源多个百亿级参数大模型,并在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。和 DeepSeek AI 对话,轻松接入 API。

DeepSeek的爆火,让其创始人梁文锋颇受关注。业内口碑称,这是一位极致的80后技术理想主义者,每天就是“看论文,写代码,参与小组讨论”。2008年起,梁文锋开始带领团队使用机器学习等技术探索全自动量化交易。2015年,幻方量化正式成立。2020年开始,幻方的AI超级计算机“萤火一号”正式投入运作。2021年,幻方投入十亿建设“萤火二号”。2023年7月,幻方量化宣布成立大模型公司DeepSeek,正式进军通用人工智能领域。2024年5月,DeepSeek发布了DeepSeekV2;同年12月27日,DeepSeek-V3面世。2025年1月20日, DeepSeek正式发布DeepSeek-R1模型。

今年1月20日下午,李强总理主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。DeepSeek创始人梁文锋出席此次座谈会,这一信息立马被市场捕捉到。对于国产大模型公司在列总理座谈会,被业内解读为国家对科技的重视。值得注意的是,这次座谈会上,李强强调,要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。

无独有偶,DeepSeek的出现和爆火世界,尤其是让美国科技界的震惊,感觉到了咄咄逼人的阵势和态势。。1月27日晚,美国总统特朗普在佛罗里达州迈阿密发表讲话时,对中国人工智能初创公司DeepSeek搅动纳斯达克一事表示,DeepSeek的出现“给美国相关产业敲响了警钟”,美国“需要集中精力赢得竞争”。特朗普同时表示,他认为,DeepSeek的模型高效且经济,其出现是一种积极的发展。DeepSeek挑战了人工智能产业在过去一段时间的核心信念,有了更强大的硬件推动人工智能发展,有望激发一波创新浪潮,推动全球AI继续进步。

鲁建军
抒发情感,书写思想。
 最新文章