浙大系、大模型届拼多多、囤了上万张芯片的量化大佬!中国最神秘量化私募,幻方量化发布DeepSeek-V3!

科技   2024-12-28 22:07   广东  

就在昨天,整个 AI 圈被一股 “来自东方的神秘力量” 狠狠震撼了一把!

国内大名鼎鼎的大模型创业公司 “深度求索”,竟然通过官方公众号重磅宣布:DeepSeek-V3 模型正式上线,而且同步开源啦!这还不算完,他们甩出的大招简直让人惊掉下巴 —— 直接公布了长达 53 页的训练和技术细节!

要知道,平日里咱们看到的那些报告,大多含糊其辞、语焉不详,可深度求索偏不!他们大方袒露,这超级惊艳、大幅升级的 V3 模型,居然是在一个低到 “超乎想象” 的预算下训练出来的。仅仅花费 557.6 万美元,在 2048xH800 集群上跑了 55 天就搞定,还毫无保留地把所有技术细节公之于众,这魄力,怎能不让人拍案叫绝!

深度求索与幻方量化的关联?
深度求索和幻方量化是什么关系?答:深度求索由幻方量化创始人梁文锋发起创立,曾被业界视为幻方量化的 “外围公司”,实则是幻方量化实控人发起的又一公司,二者在人员、股东层面存在内在联系,业务上各有侧重,深度求索专注于 AI 大模型研发。

深度求索在 AI 领域有何突出成果?
2023 年正式推出 AI 产品,此前已内部 “孵化” 许久。其模型在美国数学竞赛、全球顶级编程竞赛等表现优异,如代码场景应用在第三方测评中世界第二,数学场景排世界第三等。12 月 26 日晚,开源 DeepSeek-V3 模型,相比 DeepSeek-V2.5,生成速度提 3 倍,参数达 6710 亿,在多基准测试中超越同类开源模型,接近或赶超顶尖闭源模型,且训练成本仅 557.6 万美元,还公布 53 页训练和技术细节,真正做到开源。


一、关于幻方量化

  1. 幻方量化是什么背景?

  • 幻方量化是一家依靠数学与人工智能进行量化投资的对冲基金公司,2015年创立,连续五年荣获中国私募金牛奖,登上2022年股票策略百强榜,在量化私募圈素有“北九坤,南幻方”“四大天王”的说法。其有两家投向二级市场的内资实体:浙江九章资产管理有限公司、宁波幻方量化投资管理合伙企业(有限合伙),备案信息显示两家机构规模均超100亿元,还拥有QFII资格,旗下香港子公司为幻方资本管理(香港)有限公司。

  • 幻方量化的业绩如何?

    • 截至2022年12月,资金规模接近600亿,过去两年成绩斐然,2022年整体收益比较平淡,1月9日私募排排网发布的私募业绩榜单显示,幻方量化2022年收益为0.38%,比如幻方量化对冲9号年度收益不足7%,幻方量化对冲优选1号年度收益8.8%。

  • 幻方量化在慈善方面有何举动?

    • 2022年度,幻方量化共计向慈善机构捐赠2.2138亿元,公司员工“一只平凡的小猪”个人向慈善机构捐赠1.3800亿元,后有线索指向“一只平凡的小猪”付款人或为幻方量化创始人梁文锋。


    二、关于深度求索DeepSeek

    1. 深度求索与幻方量化是什么关系?

    • 深度求索由幻方量化创始人梁文锋发起创立,曾被业界以为是幻方量化的“外围公司”,事后证明是幻方量化实控人发起的又一个公司,二者在人员、股东等方面存在隐隐线索,业务上各自承担不同方向功能。

  • 深度求索在AI领域有哪些成果?

    • 2023年正式对外亮相AI产品,此前已内部“孵化”很久,开发的模型在多个权威评测中成绩优异,如在美国数学竞赛、全球顶级编程竞赛等超越众多同行,今年9月还宣称在代码场景应用第三方测评中世界第二,数学场景排名世界第三,在自家平台公布多个应用分项在中国排名首位。其官微多次提及“角色扮演”应用场景,用户可通过设定让大模型扮演如基金经理等角色,为公募、私募基金机构提供服务,替代部分传统“话术”。12月26日晚,宣布全新系列模型DeepSeek-V3上线并同步开源,API服务已同步更新,相比上一代模型DeepSeek-V2.5有诸多提升,如生成速度提升3倍,拥有6710亿参数,在多项基准测试中成绩超越其他开源模型,接近或赶超世界顶尖闭源模型,且训练成本极低,仅557.6万美元。

  • 深度求索的团队构成如何?

    • 团队成员多为Top高校应届毕业生、没毕业的博四、博五实习生以及毕业才几年的年轻人,没有海外回来的人,梁文锋称要自己打造顶尖人才。


    三、关于梁文锋

    1. 梁文锋个人经历是怎样的?

    • 80后,出生在广东五线城市,父亲是小学老师,毕业于浙江大学,主修软件工程、人工智能方向。2008年开始致力于量化对冲领域研究,2015年创立幻方量化,2016年幻方量化首次上线运行AI策略,2023年7月创立深度求索,专注AI大模型研究开发,每天写代码、跑代码,学习能力惊人。

  • 梁文锋的理念是什么?

    • 他认为无论是API还是AI,都应该是普惠的,人人可以用得起,强调技术服务大众而非仅为商业利益,体现在DeepSeek的定价策略上,推动行业价格战,让更多人负担得起AI技术,且坚持不贴钱、不赚取暴利,在成本之上稍有利润的原则。同时,他希望中国能从技术追随者转变为主要贡献者。


    深科技
    深科技:人工智能领军媒体,ICT大数据平台!深科技+战略!
     最新文章