性能对标OpenAI o1,Deepseek-R1推理性能评测【国金金工高智威团队】

文摘   2025-01-22 22:09   北京  






+

目录


1.DeepSeek发布最新推理模型R1

2.ETF市场回

 ▫ 一级市场资金流动情况

 ▫ 二级市场交易情况

 ▫ 增强策略ETF业绩跟踪

 ▫ 本周非货币ETF申报、认购及上市情况

3.主动权益及增强指数型基金表现跟踪

 ▫ 绩优基金跟踪

 ▫ 基金发行跟踪

4.风险提示


摘要


■ 投资逻辑 

DeepSeek发布最新推理模型R1

2025年1月20日晚,DeepSeek微信公众号宣布了DeepSeek-R1版本模型的正式上线,这是继2024年11月20日上线的DeepSeek-R1-Lite预览版之后,最新的推理模型。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力,在数学、代码、自然语言推理等多个任务上,性能比肩 OpenAI o-1217模型。目前该模型的DeepSeek网页端、手机APP、API接口、开源版本均已同步上线。

ETF市场回顾

从一级市场资金流动情况来看,上周(2025.01.13-2025.01.17)已上市ETF资金净流入合计14.11亿元,其中股票型ETF资金净流入78.43亿元,跨境ETF资金净流入19.81亿元,商品型ETF资金净流出10.10亿元,债券型ETF资金净流出74.03亿元。

在股票型ETF中,宽基ETF上周资金净流入80.24亿元,上周沪深300ETF资金净流入43.37亿元,中证1000ETF资金净流入34.04亿元,中证500ETF资金净流入18.70亿元,A500ETF资金净流入10.56亿元,科创50ETF资金净流入5.87亿元。

主题行业ETF上周资金净流入-0.93亿元。上周高端制造、科技、周期板块ETF资金净流入额分别为7.48亿元、7.10亿元、2.54亿元,医药生物、消费、金融地产板块ETF资金净流出额分别为4.37亿元、4.50亿元、8.13亿元。

上周共有15只ETF产品申报,多只科创板综合交易型开放式指数基金集中申报

主动权益及增强指数型基金表现跟踪

主动权益型基金中上周表现前五名的基金包括:前海开源沪港深乐享生活(004320.OF)、永赢半导体产业智选A(015967.OF)、格林碳中和主题A(015856.OF)、同泰开泰A(007770.OF)、鹏华碳中和主题A(016530.OF),它们的收益率分别为9.65%、9.20%、9.00%、8.70%、8.66%。

上周主动量化基金上周收益率中位数为3.24%,近1年以来收益率中位数为7.85%。上周TMT主题基金业绩相对较好,收益率中位数为3.88%。2025年以来,金融地产与TMT行业主题基金业绩领先,收益率中位数分别为25.61%、22.21%。

在沪深300增强指数型基金中,安信量化精选沪深300指数增强A(003957.OF)上周表现最佳,相对基准的超额收益率为1.65%。在中证500增强指数型基金中,鹏华中证500指数增强A(014344.OF)上周表现出色,相对业绩基准的超额收益率为0.58%。在中证1000增强指数型基金中,太平中证1000指数增强A(015466.OF)上周取得了0.68%的超额收益率。在国证2000增强指数型基金中,鹏华国证2000指数增强A(017892.OF)表现最优,取得了0.72%的超额收益率。

风险提示

以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险;基金历史业绩不代表未来;ETF二级市场价格波动风险。基金相关信息及数据仅作为基金研究使用,不作为募集材料或者宣传材料。


正文







往期报告

DeepSeek发布最新推理模型R1

2025年1月20日晚,DeepSeek微信公众号宣布了DeepSeek-R1版本模型的正式上线,这是继2024年11月20日上线的DeepSeek-R1-Lite预览版之后,最新的推理模型。

DeepSeek-R1模型以DeepSeek-V3模型为基础,通过结合大规模强化学习、冷启动数据、适当的奖励机制、自进化特性以及高效的训练算法,成功实现了深度思考的能力,在数学、代码、自然语言推理等多个任务上,性能比肩 OpenAI o-1217模型。

1.1 模型推理能力测评

首先,为了对比V3和R1模型的推理能力差异,我们对一些常见的考察逻辑思维能力的问题进行了测试。

1)问题1:给你一个装满水的浴缸,旁边有一个勺子和一个碗,你怎样把缸里的水排出去?从各个模型的答案来看,DeepSeek-R1给出了标准答案,答案优于DeepSeek-V3和ChatGPT o1模型。

2)问题2:一辆出租车在公路上正常行驶,并却没有违反任何交通规则,却被一个police给拦了,为什么?从问题2的答案来看,DeepSeek-R1答案完全正确,答案优于DeepSeek-V3,ChatGPT o1答案错误。


1.2 金融文本分析能力测评

首先,我们测试了,DeepSeek的R1、V3模型及ChatGPT o1模型是否能够根据上市公司主营业务判定概念股,考验其推理判定能力。根据我们提出的低空经济概念,DeepSeek的R1及V3模型均能给出正确的判定结果,并且准确输出该股票所属的低空经济产业链的具体环节。

我们也对DeepSeek的R1及V3模型能否准确梳理基金经理调研纪要中的投资框架进行了测评。我们要求大模型从整体投资理念、资产配置框架、行业配置框架、风格配置框架、选股框架、交易框架、风控框架等多个维度对XX基金经理调研纪要进行信息总结提取,并严格限定了输出结果的格式。

从结果来看,DeepSeek两个模型均能按照提示词要求的格式和内容提取到基金经理投资框架信息。但相比之下,DeepSeek-R1模型对投资框架的梳理更为简练,总结性更强,语言表达更为专业。而ChatGPT o1模型总结的内容较为简洁,但不及DeepSeek-R1模型输出的投资框架丰富。

综上,在我们设置的金融文本分析任务中,DeepSeek-R1模型表现出色,表现优于DeepSeek-V3,甚至可能优于ChatGPT o1模型。

1.3 模型使用:网页、API、开源模型

网页端及最新推出的手机APP,打开“深度思考”模式,即可免费调用最新版 DeepSeek-R1 完成各类推理任务,暂无使用次数限制。

API接口方面,DeepSeek-R1 上线API,对用户开放思维链内容输出,通过设置 “model='deepseek-reasoner'”即可调用。

DeepSeek-R1目前支持的上下文长度为64K(输出的 reasoning_content 长度不计入 64K),仍不及ChatGPT的o1及o1-mini模型。API价格方面,目前DeepSeek-R1价格是DeepSeek-V3模型两倍,百万tokens输出价格达到16元,但较ChatGPT的o1及o1-mini模型仍有较大的价格优势。

开源模型方面,DeepSeek今日同步开源模型权重,开源了 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型。此外,DeepSeek在协议授权等方面进行了宽松的调整,开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。在更新的线上产品的用户协议中,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

ETF市场回顾

截至2025年1月17日,全市场已上市非货币ETF共1020只,上周共2只ETF上市。

一级市场资金流动情况(2025.1.13-2025.1.17)

我们按每日份额较前一日增加额乘以前一日净值的方式计算了ETF每日的净申购/赎回额,并对发生份额拆分的ETF进行处理。

从一级市场资金流动情况来看,上周已上市ETF资金净流入合计14.11亿元,其中股票型ETF资金净流入78.43亿元,跨境ETF资金净流入19.81亿元,商品型ETF资金净流出10.10亿元,债券型ETF资金净流出74.03亿元。

在股票型ETF中,宽基ETF上周资金净流入80.24亿元,上周沪深300ETF资金净流入43.37亿元,中证1000ETF资金净流入34.04亿元,中证500ETF资金净流入18.70亿元,A500ETF资金净流入10.56亿元,科创50ETF资金净流入5.87亿元。

主题行业ETF上周资金净流入-0.93亿元。上周高端制造、科技、周期板块ETF资金净流入额分别为7.48亿元、7.10亿元、2.54亿元,医药生物、消费、金融地产板块ETF资金净流出额分别为4.37亿元、4.50亿元、8.13亿元。

二级市场交易情况(2025.1.13-2025.1.17)

2.2.1 ETF交易情况

上周非货币ETF的成交金额合计为9690.81亿元。其中股票型ETF的周成交额为4522.72亿元。在股票型ETF中,宽基ETF的成交额最高,其中A500ETF周成交额最高。在主题/行业ETF中,科技ETF周成交额最高。

从ETF融资融券情况来看,上周ETF融资净买入额为0.98亿元,其中科创50ETF融资净买入额为1.25亿元,科技ETF融资净买入额为2.11亿元,相对更获杠杆资金青睐

增强策略ETF业绩跟踪(2025.1.13-2025.1.17)

截至2025年1月17日,已有33只增强策略ETF上市交易,包含8只中证1000增强策略ETF,7只中证500增强策略ETF,4只中证2000增强策略ETF,3只沪深300增强策略ETF,3只科创50增强策略ETF,2只创业板指增强策略ETF,2只科创100增强策略ETF,1只MSCI中国A50互联互通增强策略ETF,1只上证50增强策略ETF,1只中证800增强策略ETF,1只科创创业50增强策略ETF。

上周各类增强策略ETF中,18只增强策略ETF的表现超过业绩比较基准。近1年以来,成立满1年的26只增强策略ETF中有22只取得正超额。近1年以来,招商中证1000增强策略ETF业绩最佳,近1年以来获得12.22%的超额收益率,2025年以来,华泰柏瑞中证500增强策略ETF业绩最佳,2025年以来获得1.87%的超额收益率。

本周非货币ETF申报、认购及上市情况(2025.01.20-2025.01.24)

2.4.1 上周非货币ETF基金申报情况

上周共有15只ETF产品申报,其中包含集中申报的12只上证科创板综合ETF

2.4.2 本周新发行非货币ETF情况

本周无ETF产品发行

2.4.3 本周非货币ETF上市情况

本周共有4只ETF上市,包括中证A500ETF、创业板50ETF、上证基准做市公司债ETF。

主动权益及增强指数型基金表现跟踪

3.1 绩优基金跟踪(2025.1.13-2025.1.17)

主动权益型基金中上周表现前五名的基金包括:前海开源沪港深乐享生活(004320.OF)、永赢半导体产业智选A(015967.OF)、格林碳中和主题A(015856.OF)、同泰开泰A(007770.OF)、鹏华碳中和主题A(016530.OF),它们的收益率分别为9.65%、9.20%、9.00%、8.70%、8.66%。

剔除成立不满1年的基金,截至2025年1月17日,近一年以来,灵活配置型基金中,宏利成长(162201.OF)收益最高,近一年取得61.15%的收益率,排名第一。偏股混合型基金中,大摩数字经济A(017102.OF)业绩优异,过去一年以来取得88.26%的收益率,排名第一。在普通股票型基金中,银华数字经济A(015641.OF)收益率达到73.54%,排名第一。

上周主动量化基金上周收益率中位数为3.24%,近1年以来收益率中位数为7.85%。上周TMT主题基金业绩相对较好,收益率中位数为3.88%。近1年以来,金融地产与TMT行业主题基金业绩领先,收益率中位数分别为25.61%、22.21%。

在沪深300增强指数型基金中,安信量化精选沪深300指数增强A(003957.OF)上周表现最佳,相对基准的超额收益率为1.65%。在中证500增强指数型基金中,鹏华中证500指数增强A(014344.OF)上周表现出色,相对业绩基准的超额收益率为0.58%。在中证1000增强指数型基金中,太平中证1000指数增强A(015466.OF)上周取得了0.68%的超额收益率。在国证2000增强指数型基金中,鹏华国证2000指数增强A(017892.OF)表现最优,取得了0.72%的超额收益率。

剔除成立不满1年的基金,截至2025年1月17日,近一年以来,沪深300增强指数型基金中,安信量化精选沪深300指数增强A(003957.OF)以8.75%的超额收益率排名第一;中证500增强指数型基金中,长信中证500指数增强A(004945.OF)以8.77%的超额收益率排名第一;中证1000增强指数型基金中,博时中证1000指数增强A(016936.OF)的超额收益率达到14.27%,业绩最佳;国证2000增强指数型基金中,汇添富国证2000指数增强A(019318.OF)超额收益率为11.40%,表现最好。

3.2 基金发行跟踪(2025.1.20-2025.1.24)

本周无主动权益及增强指数型基金发行。

风险提示

1)以上结果通过历史数据统计和测算完成,在市场环境发生变化时模型存在失效的风险。

2)基金历史收益不代表未来,需警惕基金未来业绩不及预期的风险。

3)市场环境发生变化,ETF二级市场交易价格存在波动的风险。

4)基金相关信息及数据仅作为基金研究使用,不作为募集材料或者宣传材料。

主动量化系列

  1. 《主动量化研究之二:当绩优基金重仓股遇到调研会发生什么“共振”?》

  2. 主动量化研究之一:择时、选股、选基——自主可控概念量化投资指南


Alpha掘金系列

  1.《Alpha掘金系列之十:细节决定成败:人工智能选股全流程重构

  2.《Alpha掘金系列之九:基于多目标、多模型的机器学习指数增强策略

  3.《Alpha掘金系列之八:FinGPT对金融论坛数据情感的精准识别——沪深300另类舆情增强因子

  4.《Alpha掘金系列之七:ChatGLM医药行业舆情精选策略——大模型微调指南

  5.《Alpha掘金系列之六:弹性与投资者耐心——基于高频订单簿的的斜率凸性因子

  6.《Alpha掘金系列之五:如何利用ChatGPT挖掘高频选股因子?

  7.《Alpha掘金系列之四:基于逐笔成交数据的遗憾规避因子

  8.《Alpha掘金系列之三:高频非线性选股因子的线性化与失效因子的动态纠正

  9.《Alpha掘金系列之二:基于高频快照数据的量价背离因子

  10.《Alpha掘金系列:多维度卖方分析师预测能力评价——券商金股组合增强策略


Beta猎手系列

  1.Beta猎手系列之十二:RAG-ChatGPT提前布局热点概念领涨股》

  2.《Beta猎手系列之七:追上投资热点——基于LLM的产业链图谱智能化生成

  3.《Beta猎手系列之六:基于宏观量价信号叠加的微盘股茅指数择时轮动策略

  4.Beta猎手系列之五:Beta猎手系列之五:基于机构调研热度和广度视角的行业配置策略 

  5.Beta猎手系列之四:如何利用ChatGPT解析卖方策略观点并构建行业轮动策略? 

  6.《Beta猎手系列之三:行业超预期的全方位识别与轮动策略》

  7.《Beta猎手系列之二:熵池模型:如何将纯主动观点纳入量化配置模型》

  8.Beta猎手系列:基于动态宏观事件因子的股债轮动策略


智能化选基系列

  1. 《智能化选基系列之七:基于AI预测中的个股Beta信息构建ETF轮动策略》

  2. 《智能化选基系列之六:如何用AI选出持续跑赢市场的基金?》

  3. 《智能化选基系列之五:如何如何刻画基金经理的交易动机并进行基金优选?》

  4. 《智能化选基系列之四:如何用LLM生成基金经理调研报告并构建标签体系?》

  5. 《智能化选基系列之三:基金经理多维度能力评价因子优化》

  6. 《智能化选基系列之二:风格轮动型基金的智能识别与量化优选》

  7. 《智能化选基系列:如何通过全方位特征预测基金业绩并构建跑赢指数的基金组合》


量化漫谈系列

  1.《量化漫谈系列之十二:全样本训练+分域微调——中证A500AI指增再优化》

  2.《量化漫谈系列之十一:中证A500指数有效因子分析与增强策略》

  3.《量化漫谈系列之十:RAG-ChatGPT读季报:公募基金经理一致观点解析》

  4.《量化漫谈系列之九:金融文本解析评测:Llama3是最强开源模型吗?》

  5.《量化漫谈系列之八:传统因子如何通过线性转换增强因子表现?

  6.《量化漫谈系列之六:为大模型插上翅膀——ChatGLM部署与Langchain知识库挂载》

  7.量化漫谈系列之六:如何精确跟踪微盘股指数?——低成交量下的抽样复制策略》

  8.量化漫谈系列之五:中证2000指数发布,如何构建微盘股指数增强策略?》

  9.《量化漫谈系列之四:成长价值和大小盘双风格轮动基金如何识别与优选?》

  10.《量化漫谈系列之三:有多少基金从新能源切换到了AI?》

  11.《量化漫谈:卖方分析师团队评价体系与特征全景》

  12. 量化漫谈:预期差视角下的业绩预喜个股机会梳理


量化掘基系列

  1.《量化掘基系列之二十七:量化视角下,如何布局科创50指数?》

  2.量化掘基系列之二十六 :黄金持续新高,该如何把握后续行情?》

  3.量化掘基系列之二十五:若红利税下调,对港股影响几何?》

  4.《量化掘基系列之二十四:新“国九条”下,如何把握红利投资浪潮?》

  5.《量化掘基系列之二十三:把握HBM高景气度及半导体产业复苏的投资机会》

  6.《量化掘基系列之二十二:产业链视角下如何捕捉AI手机概念行情?

  7.《量化掘基系列之二十一:低波震荡下的投资利器——泰康中证红利低波动ETF》

  8.《量化掘基系列之二十:深度学习赋能市场中性基金,量化对冲类产品前景广阔》

  9.《量化掘基系列之十九:量化视角下,央企概念有哪些投资机会?

  10.《量化掘基系列之十八:汇聚龙头,启航新境——华泰柏瑞中证A50ETF

  11.《量化掘基系列之十七:红利叠加低波会碰撞出怎样的火花?

  12.《量化掘基系列之十六:控制微盘风格暴露,机器学习赋能量化投资

  13.《量化掘基系列之十五:低波因子是否才是中证 500 选股真正利器?

  14.《量化掘基系列之十四:“哑铃”策略的一头,红利策略哪只强?》

  15.《量化掘基系列之十三:多重利好驱动小微盘行情,中证2000指数迎配置机遇》

  16.《量化掘基系列之十二:高成长高弹性,掘金科创100估值底》

  17.《量化掘基系列之十一:高股息+低估值,顺周期行业配置首选》

  18.《量化掘基系列之十:行业龙头强强联合,中韩半导体产业迎布局机遇

  19.《量化掘基系列之九:量化视角把握专精特新“小巨人”投资机会》

  20.《量化掘基系列之八:国企改革持续推进,现代能源产业投资正当其时

  21.《量化掘基系列之七:低利率环境下的投资法宝——招商中证红利ETF

  22.《量化掘基系列之六:如何从多个维度衡量ETF的景气度特征》

  23.《量化掘基系列之五:震荡行情下的投资利器——华泰柏瑞中证红利低波动ETF》

  24.《量化掘基系列之四:量化择时把握创业板50指数投资机会》

  25.量化掘基系列之三:ChatGPT概念加速起飞,大数据产业链投资指南

  26.《量化掘基系列之二:量化择时把握港股通大消费板块投资机会

  27.量化掘基:银河基金罗博:机器学习赋能主动量化投资


CTA金点子系列

  1. 《CTA金点子系列之二:基于日内高频博弈信息的商品CTA策略

  2. 《CTA金点子系列之一:基于ChatGPT新闻情感分析的原油期货策略》


年度投资策略

  1. 《金融工程2023年度投资策略:拨云见日终有时》

  2. 《金融工程2024年度策略:小盘股为帆,AI量化掌舵》

  3. 《金融工程2025年度策略:LLM破局Alpha困境,拥抱Beta大时代》




报告信息

证券研究报告:《基金量化观察:性能对标OpenAI o1Deepseek-R1推理性能评测》

对外发布时间:2025年1月21日

报告发布机构:国金证券股份有限公司


证券分析师:高智威

SAC执业编号:S1130522110003

邮箱:gaozhiw@gjzq.com.cn


证券分析师:赵妍

SAC执业编号:S1130523060001

邮箱:zhao_yan@gjzq.com.cn


联系人:聂博洋

邮箱:nieboyang@gjzq.com.cn






量化智投
国金证券金融工程高智威团队。研究范围涵盖了量化选股、资产配置、基金研究以及衍生品投资等领域。
 最新文章