美本早申竞争白热化!加国娃如何在名校早申中逆风翻盘?
这款中国自产APP, 令其在苹果App Store的下载排行榜中冲上第一名,将ChatGPT远抛在后。而且,它以低成本高性能的AI模型表现,与OpenAI的ChatGPT-4等全球顶尖AI语言模型不相上下,令整个矽谷为之震撼,更让美国科技巨头Meta的生成式AI部门陷入危机。
美国股市27日收盘,三大指数涨跌互见,科技股方面由于中国AI新创公司DeepSeek开发低成本大语言模型,再度引发市场对于美国企业在AI研发投入太多资金的疑虑,辉达收盘重挫近17%,市值蒸发6000亿美元。
DeepSeek究竟是何方神圣?
WATCH POPULAR NEWS
此后,他们(DeepSeek)近日在短短一个月内接连推出V3和R1两款大模型,迅速引发全球瞩目。DeepSeek-R1在数学、代码、自然语言推理等多项任务的性能已达到OpenAI GPT-4o模型的水平,且以低成本、高性能和开放性赢得了广泛赞誉,甚至成为斯坦福大学和麻省理工学院研究人员的首选模型。
但是 OpenAI、Google、Meta 和其他公司已经有很多 AI 模型了。这有什么大不了的?
WATCH POPULAR NEWS
一位自称是Meta员工的网友,日前在美国匿名职场论坛TeamBlind上发文,表示DeepSeek横空出世后,技术水准就直接超越了Meta旗下的Llama 4,让Meta全公司上下陷入恐慌。更令Meta难堪的是,这家中国企业只用了550万美元来训练DeepSeek,成本只有Meta的十一分之一。
这名员工坦言,DeepSeek以超低成本完成大规模模型训练,颠覆了行业对高昂成本的传统认知,因为「单只Meta生成式AI部门里的主管薪资就已超过了DeepSeek训练AI的成本,而且我们这里有几十位领着高薪的主管,我根本无法想像他们该如何向公司证明部门目前高额成本的合理性。
外媒The Information指出,OpenAI、Meta和其他顶尖AI公司的工程师正疯狂地研究DeepSeek模型,试图解读其技术秘密,复制其成功模式,但暂时还不得其解。Meta更为此筹组了4个"战情室",2个聚焦研究如何降低训练和运作DeepSeek的成本,另2个则负责厘清DeepSeek使用了哪些数据来训练其模型,及基于DeepSeek模型归纳出的特质,重新建构Meta的模型。
福利 | 多伦多仅此一场!春节【动力火车世界巡回演唱会】2/1 瀑布开唱
谁负责?
WATCH POPULAR NEWS
梁文锋说过自己的父亲是一名小学老师。可惜梁文锋就读的小学、中学均没有公开信息。只知道他是一位数学建模爱好者。(也有朋友留言说他是湛江吴川人,毕业于吴川一中)
他国中就提前完成高中数学课程,开始学习大学数学。
2002年9月至2006年6月,17岁的梁文锋来到浙江杭州,以湛江吴川市第一中学「高考状元」成绩考入浙江大学电子资讯工程科。
2007年,22岁的梁文锋又考上浙江大学信息与通信工程专业研究生。师从项志宇,主要做机器视觉研究,并在校期间对金融市场产生了浓厚的兴趣。
在2008年全球金融危机期间,梁文峰带领团队探索机器学习技术在全自动量化交易中的应用潜力。经过两年的努力,2010年沪深300股指期货推出,量化投资迎来了机遇,梁文峰和他的团队成功赚取了大量资金,自营资金超过5亿元。
2023年,梁文峰正式成立了DeepSeek,这家专注于人工智慧大模型技术研发的创新公司。成立一年后,DeepSeek就推出了让业界瞩目的产品。去年5月,公司发布了DeepSeek-V2,以其创新的模型架构和史无前例的性价比(CP值)引发了广泛关注,迅速在AI领域占据一席之地。
END
冲鸭!2024 圣诞节🤶加勒比海,海景阳台房人均1千
北非后花园 | 摩洛哥经典环线9日豪华游|一价全包,无需签证!~
✨迪士尼Destiny命运号|2026.1.4亲子团
限时预订!🚨Expedia 2024黑五预热|8大邮轮品牌钜惠来袭
预约进店,立送$300家装礼包+V:MeetInT0
END