中国骄傲:梁文锋带领“DeepSeek”超越ChatGPT,血洗美股!成苹果美国区免费APP下载首位

教育   2025-01-28 08:13   加拿大  




“生活娱乐资讯,尽在多伦多西区那些事儿”

美本早申竞争白热化!加国娃如何在名校早申中逆风翻盘?



和ChatGPT打擂台,DeepSeek家人们用起来没?
迅雷不及掩耳,黑马DeepSeek火了。

       这款中国自产APP,  令其在苹果App Store的下载排行榜中冲上第一名,将ChatGPT远抛在后。而且,它以低成本高性能的AI模型表现,与OpenAI的ChatGPT-4等全球顶尖AI语言模型不相上下,令整个矽谷为之震撼,更让美国科技巨头Meta的生成式AI部门陷入危机。


美国股市27日收盘,三大指数涨跌互见,科技股方面由于中国AI新创公司DeepSeek开发低成本大语言模型,再度引发市场对于美国企业在AI研发投入太多资金的疑虑,辉达收盘重挫近17%,市值蒸发6000亿美元。










DeepSeek究竟是何方神圣?

WATCH POPULAR NEWS



DeepSeek 是一家总部位于杭州的中国人工智能公司,几年前由一家大学创业公司发展而来。该公司宣称的目标是打造通用人工智能,即目前还没有一家科技公司能够实现的与人类水平相当的智能。目前还没有,但这可能是 DeepSeek 的计算机科学家采用不同方法构建人工智能模型的原因之一,因此其运营成本似乎比美国竞争对手低很多倍。 


DeepSeek团队最大的特点是名校、年轻,即使是团队Leader级别,年纪也多在35岁以下,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。有负责大模型领域挖掘高端科技人才的猎头说,DeepSeek对人才的内核标签都是「年轻高潜」,年龄约在1998年出生,工作经验最好不要超过五年,「聪明、理工科、年轻、经验少」。


仅仅不到一年的2024年5月,DeepSeek就发布了DeepSeekV2,因高性价比火爆出圈,又被称为「AI界的拼多多」,引发了字节、阿里、百度等大厂的大模型价格战。


此后,他们(DeepSeek)近日在短短一个月内接连推出V3和R1两款大模型,迅速引发全球瞩目。DeepSeek-R1在数学、代码、自然语言推理等多项任务的性能已达到OpenAI GPT-4o模型的水平,且以低成本、高性能和开放性赢得了广泛赞誉,甚至成为斯坦福大学和麻省理工学院研究人员的首选模型。








但是 OpenAI、Google、Meta 和其他公司已经有很多 AI 模型了。这有什么大不了的?

WATCH POPULAR NEWS


该模型使用一种不同的内部架构,需要更少的内存,从而大大降低了每次搜索或与聊天机器人式系统交互的计算成本。研究员称赞它能够处理复杂的推理任务,特别是在数学和编码方面,而且它似乎只用一小部分的计算能力就能产生与竞争对手相当的结果。


DeepSeek 表示,开发该模型只用了两个月的时间,花费不到 600 万美元,尽管一些观察人士警告说,这可能是一个低估。尽管如此,这比硅谷科技公司开发人工智能所花费的数十亿美元要少得多,而且运营成本也更低。 









一位自称是Meta员工的网友,日前在美国匿名职场论坛TeamBlind上发文,表示DeepSeek横空出世后,技术水准就直接超越了Meta旗下的Llama 4,让Meta全公司上下陷入恐慌。更令Meta难堪的是,这家中国企业只用了550万美元来训练DeepSeek,成本只有Meta的十一分之一。


这名员工坦言,DeepSeek以超低成本完成大规模模型训练,颠覆了行业对高昂成本的传统认知,因为「单只Meta生成式AI部门里的主管薪资就已超过了DeepSeek训练AI的成本,而且我们这里有几十位领着高薪的主管,我根本无法想像他们该如何向公司证明部门目前高额成本的合理性。


外媒The Information指出,OpenAI、Meta和其他顶尖AI公司的工程师正疯狂地研究DeepSeek模型,试图解读其技术秘密,复制其成功模式,但暂时还不得其解。Meta更为此筹组了4个"战情室",2个聚焦研究如何降低训练和运作DeepSeek的成本,另2个则负责厘清DeepSeek使用了哪些数据来训练其模型,及基于DeepSeek模型归纳出的特质,重新建构Meta的模型。


福利 | 多伦多仅此一场!春节【动力火车世界巡回演唱会】2/1 瀑布开唱




谁负责?

WATCH POPULAR NEWS


一个关键人物是梁文锋,他曾管理一家中国量化对冲基金,目前为 DeepSeek 提供资金。在一次罕见的采访中,他表示:“多年来,中国公司习惯于别人做技术创新,而我们专注于应用货币化——但这不是必然的。在这波浪潮中,我们的出发点不是利用机会快速获利,而是到达技术前沿,推动整个生态系统的发展……我们认为,随着经济的发展,中国应该逐渐成为贡献者,而不是搭便车者。”








创办人梁文峰1985年出生于广东省湛江市,自小展现出非凡数学天赋。

梁文锋说过自己的父亲是一名小学老师。可惜梁文锋就读的小学、中学均没有公开信息。只知道他是一位数学建模爱好者。(也有朋友留言说他是湛江吴川人,毕业于吴川一中)

他国中就提前完成高中数学课程,开始学习大学数学。


2002年9月至2006年6月,17岁的梁文锋来到浙江杭州,以湛江吴川市第一中学「高考状元」成绩考入浙江大学电子资讯工程科。




2007年,22岁的梁文锋又考上浙江大学信息与通信工程专业研究生。师从项志宇,主要机器视觉研究,并在校期间对金融市场产生了浓厚的兴趣。


在2008年全球金融危机期间,梁文峰带领团队探索机器学习技术在全自动量化交易中的应用潜力。经过两年的努力,2010年沪深300股指期货推出,量化投资迎来了机遇,梁文峰和他的团队成功赚取了大量资金,自营资金超过5亿元。


2023年,梁文峰正式成立了DeepSeek,这家专注于人工智慧大模型技术研发的创新公司。成立一年后,DeepSeek就推出了让业界瞩目的产品。去年5月,公司发布了DeepSeek-V2,以其创新的模型架构和史无前例的性价比(CP值)引发了广泛关注,迅速在AI领域占据一席之地。


 |安省Treetop Trekking+北美最大户外蹦床公园一起High


       


END




冲鸭!2024 圣诞节🤶加勒比海,海景阳台房人均1千


北非后花园 | 摩洛哥经典环线9日豪华游|一价全包,无需签证!~


✨迪士尼Destiny命运号|2026.1.4亲子团


限时预订!🚨Expedia 2024黑五预热|8大邮轮品牌钜惠来袭





预约进店,立送$300家装礼包+V:MeetInT0


为了更好的服务大家
让大家更及时了解GTA咨询
更多多伦多新闻+吃喝玩乐
尽情关注「多伦多那些事儿」
👇 👇 👇

END


多伦多西区那些事儿

是一个服务于新移民以及多伦多西区本地生活的微信公众号,我们会发布关于加拿大多伦多西区(密西沙加,奥克维尔,米尔顿,伯林顿,哈密尔顿)的最新最快的本地资讯。请点击标题下“多伦多地区那些事儿”关注我们,引用本号稿件必须经过允许,并醒目注明出处。

长按指纹 > 识别图中二维码 > 添加关注
多伦多西区那些事儿,每天等着你







多伦多西区那些事儿
全多伦多西区最受欢迎的账号。西区小叮当会尽量拿出百宝袋里你要的宝贝,帮你解决问题,实现梦想和愿望。第一时间告诉你多伦多乃至加拿大🇨🇦发生的各种生活资讯。
 最新文章