85后创始人,近日火爆全网

时事   2025-01-27 21:50   江苏  
中国AI公司的创造力
正技惊四座

最近几天
一家名为深度求索(DeepSeek)的
中国公司在欧美AI圈
引起了不小的震动
甚至被认为是大模型行业的
最大“黑马”
DeepSeek
被不少外国人
称为“神秘的东方力量”



1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

苹果美国区应用商店


苹果App Store中国区免费榜


把开源模型做到全球第一

和公司团队开发

大模型“DeepSeek-V3”的

科技创业者

是来自广东湛江的梁文锋

近日

这名85后还现身《新闻联播》

梁文锋
土生土长的湛江人
初中就学完高中数学


梁文锋从小成绩优异

小学六年级时

他就通过考试被吴川一中录用

在吴川一中完成了初中、高中学业

一直是学校里的“尖子生”

并在数学学科表现出极大天赋


“他初中就学完高中的数学,甚至已经开始学大学的数学,数学思维能力很强。”梁文锋的初中班主任容先生表示,初中时期的梁文锋性格很文静,但不是书呆子,他在学习上很有自己的“一套方法”,很注重劳逸结合,仿佛不需要花很多时间来学习就可以学好每一个学科。

 

最后一排右边第6个是梁文锋


2002年,梁文锋17岁,他以吴川一中高考第一名成绩考上浙江大学本科电子信息工程专业,于2007年考上浙江大学信息与通信工程专业研究生。据悉,在大学期间,梁文锋就与同学一起开始积累市场行情数据和探索全自动量化交易。


2023年,梁文锋创立深度求索品牌DeepSeek。


DeepSeek是什么?

为何技惊四座?


DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。


近日,DeepSeek发布推理模型R1,在性能逼近OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。

《纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。


低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。这种方法不仅提高了训练效率,还减少了对昂贵计算资源的依赖。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。

有人提出,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。


来源 | 广州日报综合湛江发布、北京日报
编辑 | 沐沐




现代+惊喜

参与互动

就有机会拿精美礼品



参与方式:


①点击下方关注现代快报微信公众号,阅读现代快报微信公众号推送的每篇文章,并在下方“点赞”(给文章“点赞”)



②累计“点赞”量最高的网友可获得华为FreeBuds 5i 无线入耳式降噪蓝牙耳机一副,颜色随机。(排名系统会自动统计)


③获奖名单、领取方式将于2025年2月10日公布。


点赞、分享、推荐、留言安排一下?

现代快报
新新闻 新文化;讲真话 办实事 树正气
 最新文章