浙大校友梁文锋创办的国产大模型公司杭州深度求索(DeepSeek),其开发的AI应用程序引发全球轰动,其在美国苹果App Store免费榜上已经排在第一位,力压先前霸榜的ChatGPT,而排在第三的则是Meta旗下的Threads。
DeepSeek,引发英伟达(NVDA)市值蒸发5890亿美元
英伟达表示,DeepSeek是一项卓越的人工智能进展,也是测试时扩展的绝佳范例。DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力创建新模型。
85后创始人梁文锋,毕业于浙大,AI炒股,国内量化私募「四大天王」
综合媒体报道,DeepSeek的创始人梁文锋,1985年出生于广东,湛江市吴川市覃巴镇米历岭村人,2002年以吴川市第一中学「高考状元」的成绩考入浙江大学电子信息工程专业,于2010年获浙江大学信息与通信工程硕士学位。
2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了令人瞩目的成绩。2021年幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的「四大天王」之列。
2023年,他创办深度求索DeepSeek,专注于做真正人类级别的人工智能。
DeepSeek颠覆AI格局:廉价硬件与开源设计或成未来趋势
DeepSeek的下载量,一连两日超越ChatGPT、豆包等AI应用,同时在美国和中国iOS免费应用下载榜居首。
推理模型DeepSeek-R1于上周发布,DeepSeek声称该模型在数学、代码、自然语言推理等任务的性能比肩OpenAI o1正式版。尽管R1的训练成本尚未公布,其定价仅为OpenAI o1的三十分之一。
事实上,DeepSeek去年12月发布的6710亿参数大语言模型DeepSeek-V3已经吸引广泛关注,该模型的性能与GPT-4o和Claude-3.5-Sonnet相当,惟技术文件披露该模型的训练使用了2048张辉达的H800芯片,耗时两个月,训练成本不足558万美元,只相当于GPT-4o的5%。
硅谷风投创办人Marc Andreessen赞DeepSeek R1是「所见过最令人惊叹、印象深刻的突破之一」,该模型开源是「对全世界的大礼」。他又把R1形容为AI界的「史普尼克时刻」(Sputnik Moment)。
国产游戏《黑神话:悟空》开发商「游戏科学」创办人冯骥更在社交平台称,DeepSeek可能是国运级别的科技成果,赞扬DeepSeek的AI大模型同时做到强大、便宜、开源、免费等。
据报道DeepSeek团队最大的特点就是年轻。应届生、在读生,特别是来自清北的应届生在其中非常活跃,“只招1%的天才,去做99%中国公司做不到的事情。”面试过DeepSeek的应届生这样评价其招聘风格。梁文峰曾表示:DeepSeek在招人时主要看能力,而不是看经验。“我们的核心技术岗位,基本以应届和毕业一两年的人为主”。并且梁文锋还表达,“V2模型没有海外回来的人,都是本土的。前50名顶尖人才可能不在中国,但也许我们能自己打造这样的人。”
Meta紧急设立四大战略小组,研究DeepSeek技术
香港2024年:71家新股、募资875亿,逾七成来自TMT、医疗健康、消费行业,目前共2631家上市公司
香港上市中介机构排行榜:中金、普华永道、竞天公诚、高伟绅,继续领先 (过去两年:2023 & 2024)