DeepSeek-V3发布，性能比肩头部模型

文摘 2025-01-03 18:50 上海

一、DeepSeek-V3发布，性能比肩头部模型

1. 模型推理能力与易错题测评

2. 模型金融文本分析能力测评

二、DeepSeek-V3模型架构与训练机制解析

1. 模型框架创新：DeepSeekMoE架构与MTP

2. 后训练引入RL技术对齐人类偏好

三、ETF轮动策略跟踪

1. ETF轮动因子及策略近期表现

2. 本周建议关注ETF

四、高频因子超额收益概览

五、各类高频因子近期表现跟踪

1. 高频价格区间因子

2. 高频量价背离因子

3. 遗憾规避因子

4. 斜率凸性因子

六、基于基本面因子与高频因子构建的中证1000指数增强策略表现

附录一：高频“金”组合中证1000指数增强策略本周持仓列表

附录二：高频&基本面共振组合中证1000指数增强策略本周持仓列表

风险提示

摘要

■ 投资逻辑

DeepSeek-V3发布，性能比肩头部模型

12月26日，幻方旗下深度求索（DeepSeek）发布DeepSeek-V3大模型，模型展现出可以媲美海外头部大模型的卓越性能，在MATH 500和AIME 2024这类考察高级数学推理能力、以及Codeforces等考察代码能力的测试集上得分甚至超过其他闭源模型，包括GPT-4o与Claude-3.5-Sonnet。我们也对模型在推理思考与金融文本分析方面的性能进行了评估对比，发现其已有接近OpenAI的o1模型的综合能力，对金融文本的分析结果也与人工判断相符合。

DeepSeek-V3模型架构与训练机制解析

我们对DeepSeek-V3模型的底层机制进行了详细解读，分析其在性能与成本上取得优势的原因。DeepSeek-V3在模型架构与模型训练层面均有创新性的贡献，不仅在DeepSeekMoE架构下引入了无辅助损失均衡的路由策略，还使用多Token预测的机制，提升对训练数据的使用效；还在后训练过程中使用SFT微调+RL训练思维链的方法，增强模型的在推理与非推理数据上的综合能力。

ETF轮动因子跟踪

我们对前期使用GBDT+NN机器学习因子构建的ETF轮动策略进行跟踪测试，发现因子在样本外表现出色：上周IC值达38.90%，多头超额收益率为1.94%。策略的年化超额收益率为12.11%，信息比率为0.69 ，超额最大回撤为17.31%，上周超额收益率0.05%，本月以来超额收益率1.65%，今年以来超额收益率7.22%，近期表现优异。

高频因子跟踪

我们对前期挖掘的高频选股因子进行跟踪测试，发现因子在样本外整体表现出色。就上周表现来看，价格区间因子多头超额收益率0.73%，价量背离因子-0.10%，遗憾规避因子0.27%，斜率凸性因子0.15%。本月以来，价格区间因子多头超额收益率为3.55%，价量背离因子-0.49%，遗憾规避因子-1.16%，斜率凸性因子-1.51%。今年以来高频因子表现整体都比较优秀，价格区间因子多头超额收益率8.80%，价量背离因子2.85%，遗憾规避因子9.24%。斜率凸性因子表现欠佳，多头超额收益率-3.18%。

其中价格区间因子衡量股票在日内不同价格区间成交的活跃程度，能体现出投资者对于股票未来走势的预期。该因子展现出了较强的预测效果，今年以来表现比较稳定。价量背离因子主要衡量股票价格与成交量的相关性，一般而言相关性越低，未来上涨的可能性越高。但该因子近几年表现一直不太稳定，多空净值曲线趋近走平，不过今年超额收益处于历史较高水平。遗憾规避因子通过考察股票当天被投资者卖出后反弹的比例和程度，展现了较好的预测效果。该因子样本外超额收益稳定，表明A股投资者的遗憾规避情绪依然会显著影响股价的预期收益。而斜率凸性因子则从投资者耐心与供求关系弹性的角度出发，刻画订单簿的斜率和凸性对预期收益的影响。

我们将三类高频因子首先等权合成后构建出了高频“金”组合中证1000指数增强策略，该策略年化超额收益率10.37%，超额最大回撤为6.04%。上周录得0.51%的超额收益，本月以来超额收益为2.02%，今年以来超额收益为6.48%。

为考虑进一步增强策略的业绩表现，我们将高频因子与三个比较有效的基本面因子进行等权合成构建出了高频&基本面共振组合中证1000指数增强策略，该策略在样本外超额收益稳定。上周录得1.57%的超额收益，本月以来超额收益为3.34%，今年以来超额收益率为9.01%。截止到上周，该策略的年化超额收益率为14.94%，超额最大回撤为4.52%。

正文

一、DeepSeek-V3发布，性能比肩头部模型

12月26日，幻方旗下深度求索（DeepSeek）发布DeepSeek-V3大模型，一款混合专家（MoE）架构的大语言模型，参数量为671B，且为开源大模型。模型展现出可以媲美海外头部大模型的卓越性能，在MATH 500和AIME 2024这类考察高级数学推理能力、以及Codeforces等考察代码能力的测试集上得分甚至超过其他闭源模型，包括GPT-4o与Claude-3.5-Sonnet。

模型除了具有优越的性能，其训练成本也格外低。论文展示了Deepseek-V3模型训练过程中每一步骤的耗时与价格，其中最耗时的预训练步骤平均每万亿token仅需要180K个H800 GPU小时，因此整个预训练阶段在deepseek的2048块H800GPU集群上仅需要不到两个月的时间即可完成。假设单块H800显卡每GPU小时的租赁价格为2美元，整体训练的测算成本约为557.6万美元。

当前DeepSeek-V3已经同步上线网页端与API接口，其中API服务定价为每百万输入tokens 0.5元（缓存命中）/2元（缓存未命中），每百万输出tokens 8元。

1. 模型推理能力与易错题测评

我们也对模型进行了一定测评，展示其在真实推理与金融文本处理方面的能力。

首先是大模型在推理题与笑话上的表现对比，本文特别挑选了6道带有推理属性的易错题，旨在测试模型的真实推理能力与人类对齐的表现。

以下是各个模型的回答情况对比。

整体上，在推理与人类对齐方面DeepSeek-V3模型已有接近OpenAI的o1模型的能力，其中四道数学运算的题目DeepSeek-V3能全部答对，但剩下两道偏向于脑筋急转弯的问题则无法给出正确答案，且尝试多次均无法正确回答。

以下为DeepSeek-V3模型对部分问题的回答详情，截图部分略去了深度思考模式中展示的模型思维链细节内容。

值得注意的是，在网页端使用DeepSeek-V3并使用“深度思考”模式时，模型会展示其求解过程中的思维链内容。从思维链来看，模型的求解过程逻辑显得较为繁复冗长，还有提升空间。

2. 模型金融文本分析能力测评

在投资研究领域，大模型的一个重要应用场景是处理海量信息和文本，能够有效地提炼和总结关键信息，分析作者的观点，并快速定位并回答投资者关注的问题。此前我们已设计出基于研报阅读与问答场景的三个问题，并对部分主流开源大模型进行提问评估与对比。本次我们对DeepSeek-V3进行相同的测试与对比。

考虑到目前大模型在面对复杂问题时的有限能力，确保模型的思考角度与我们预期一致，我们对三个问题均使用One-Shot或Few-Shot的方式设计提示词以提升模型回答准确度。我们共搜集了3篇国金证券研究所发布的个股研报摘要，包括：《人福医药(600079)：麻醉行业壁垒突出，公司重回增长赛道》、《中航沈飞(600760)：歼击机摇篮拥抱空海军建设浪潮军贸、维修打开长期发展空间》和《珀莱雅(603605)深度更新：持续引领行业变革的本土美妆集团》。3篇研报选自3个不同行业，涉及不同的研究框架和投资逻辑。以下是DeepSeek-V3模型的回答具体内容。

我们将大模型对3个问题的回答整理如下，其中明显错误的回答标红。

可以看出，由于研报文本天然的乐观倾向，即便我们在提示词中已经要求模型对细微用语差异进行判别，但模型依然难以准确区分研报作者的看好程度，绝大部分模型所给出评分都较相近。而在技术水平、行业壁垒与政策影响提取中，DeepSeek模型也展示出较准确的分析能力，包括对人福医药具有一定行业壁垒、珀莱雅相关文段中未提及政策影响的判断，是与人类判断相符合的。

二、DeepSeek-V3模型架构与训练机制解析

整体来说，DeepSeek-V3模型在性能、成本等方面均具有显著优势，原因在于deepseek在模型的架构与训练阶段均做出了提升。

1. 模型框架创新：DeepSeekMoE架构与MTP

DeepSeek-V3的主体架构继续沿用V2模型的DeepSeekMoE架构，在其基础上创新性地提出了无额外损耗负载均衡策略（Auxiliary-Loss-Free Load Balancing），最终能对专家模型的选择进行可学习的动态调整，进一步避免无效的资源分配，在模型负载与性能之间实现更好平衡。

从无辅助损失（Aux-Loss-Free）与有辅助损失（Aux-Loss-Based）的对比情况来看，无额外辅助损失能更好唤醒特定的专家模型，分工更为明确，这表明策略能更好释放MoE的潜力。同时在大多数评估基准上，无辅助损失均衡策略下MoE模型展现了一致更好的评估分数。

此外，DeepSeek-V3还引入了MTP（Multi-Token Prediction）策略，能够同时预测接下来的多个token，相比于传统的仅预测下一个token的方法可以扩展其训练数据的信息密度，更有效利用数据。

2. 后训练引入RL技术对齐人类偏好

DeepSeek-V3模型的后训练阶段包括SFT（有监督微调）与RL（强化学习）两个步骤。其中，SFT阶段使用DeepSeek-R1生成的数学、代码等高质量推理数据，以及DeepSeek-V2.5生成的创意写作等非推理类数据进行蒸馏，得到训练数据后对模型进行微调。

为了模型更好对齐人类偏好，DeepSeek-V3还采用了强化学习技术，构建了两类奖励机制来训练模型生成恰当的思维链。其中，对于具有明确规则进行判别的任务（数学题、编程题等），奖励机制会对每一次思考结果进行奖惩，推动模型向正确方向思考；对于无明确答案的任务，DeepSeek-V3则会作为“奖励模型”对问题与回答进行综合评价并给出打分，并将这一打分用于后续增强学习的奖励。这一过程中，奖励模型发挥了极大的作用，其生成的分数对最终对齐的效果起到决定性作用。

而DeepSeek-V3在作为奖励模型方面的表现也要优于其他主流大模型。在专门评价奖励模型的数据集RewardBench上，DeepSeek-V3系列模型的得分不同程度超过GPT-4o与Claude-3.5-Sonnet。

3. 其他改进

此外，DeepSeek-V3的预训练语料库规模达到14.8万亿token。为了确保模型在数学与编程领域的推理质量，语料库中相关文档的占比大幅提高。此外，他们还开发了一套完善的数据处理流程，借鉴使用了文档级打包（Document Packing）方法，将多个文档拼接成一个训练样本，并最小化数据冗余，避免了传统方法中由于截断导致的上下文信息丢失，确保模型能够学习到更完整的语义信息。针对代码数据，DeepSeek-V3借鉴了Fill-in-Middle（FIM）方法，将10%比例的代码数据构造成“填空”的形式，迫使模型学习代码的上下文关系，从而提升代码生成和补全的准确性。

除此之外，DeepSeek在模型的基础建设方面也做出了诸多创新，多项工程优化贯穿了流水线并行、通信优化、内存管理与低精度训练等多个方面，共同促成了DeepSeek-V3模型的优越性能。

三、ETF轮动策略跟踪

1. ETF轮动因子及策略近期表现

在前期报告《智能化选基系列之七：基于AI预测中的个股Beta信息构建ETF轮动策略》中，我们使用在选股方面效果较好的GBDT+NN机器学习因子，通过个股映射到指数，再根据一定的筛选条件选择对应ETF的方式构建了周度调仓的ETF轮动策略，策略在样本外表现整体表现良好。

上周，因子表现良好，IC值为38.90%，多头超额收益率为1.94%。

若考虑双边千二的手续费，以沪深300指数作为比较基准，回测期为2015年2月至今，策略以每周第一个交易日的收盘价买入进行周频调仓，每期根据ETF轮动因子的十分组多头组作为拟持仓ETF，并叠加换手率缓冲的方式以降低高换手带来的策略影响。策略表现如下：

策略年化超额收益率为12.11%，信息比率0.69，超额最大回撤为17.31%。

策略上周超额收益率0.05%，本月以来超额收益率1.65%，今年以来超额收益率7.22%，近期表现优异。

2. 本周建议关注ETF

根据最新的策略信号，本周ETF持仓列表如下：

四、高频因子超额收益概览

过去一周，各类高频因子多头组合在中证1000指数成分股中的表现稳定。其中，价格区间类因子多空收益率0.14%，多头超额收益率0.73%。量价背离因子多空收益率1.33%，多头超额收益率-0.10%。遗憾规避因子多空收益率为-0.11%，多头超额收益率0.27%。以下为各大类高频因子的周度表现：

五、各类高频因子近期表现跟踪

1. 高频价格区间因子

在前期研究中，我们从高频数据的角度探究了市场的日内微观结构。利用三秒的快照数据，发现：

高价格区间成交笔数与成交量因子与股票未来收益呈现显著的负相关性，即股票在日内高价格区间投资行为聚集程度与成交活跃度越低，未来上涨可能性越大。低价格区间平均每笔成交量因子与股票未来收益呈现显著的正相关性，即低价格区间的平均每笔成交量越大，大资金活跃程度越高，股票未来上涨可能性越大。

我们发现高价格80%区间成交量因子（VH80TAW）、高价格80%区间成交笔数因子（MIH80TAW）和低价格10%区间每笔成交量因子（VPML10TAW）在周频的调仓频率上表现较好。三个细分因子的近期表现如下：

我们以25%、25%和50%的权重对三个因子进行合成，对合成后因子进行行业市值中性化，得到的价格区间因子净值曲线如下：

可以看出，因子在样本外表现出色，超额净值曲线稳定向上，近期表现稳定。因子在上周、本月以来和今年以来的超额收益表现如下。

2. 高频量价背离因子

在前期深度报告《Alpha掘金系列之二：基于高频快照数据的量价背离选股因子》中，我们发现，当量价出现背离时，无论当前股价处在上升还是下降通道，未来上涨的可能性均较高；同理，当量价趋同时，股价未来下跌的可能性较高。

我们利用高频快照数据对价格和成交量的相关关系进行衡量，分别用快照成交价和快照收益率与快照成交量、成交笔数和每笔成交量计算。发现在周频的调仓频率上，价格与成交笔数的相关性（CorrPM）和价格与成交量的相关性（CorrPV）表现较好，两个细分因子的近期表现如下：

我们对上述两个因子进行等权合成，对合成后因子进行行业市值中性化，得到的量价背离因子净值曲线如下：

可以看出，因子自2020年以来，收益呈现出下降的趋势，也和众多机构开始越来越多使用高频因子有关。因子在样本外整体表现也比较平淡，但今年以来表现良好，能相对稳定获取正的超额收益。因子在上周、本月以来和今年以来的超额收益表现如下。

3 遗憾规避因子

在前期深度报告《Alpha掘金系列之四：基于逐笔成交数据的遗憾规避因子》中，我们利用行为金融学中的遗憾规避理论发现，利用投资者的遗憾规避情绪可以构造出有效的选股因子。如某只股票买入浮亏占比较高或买入浮亏程度较大时，股票的预期收益会更高；卖出后股价反弹的占比越高或反弹程度越大时，股票的预期收益会更低。

我们利用逐笔成交数据区分了每笔交易的主动买卖方向，发现在加入小单和尾盘的限制后，因子的表现有进一步的提升。在周频上，卖出反弹占比因子（LCVOLESW）和卖出反弹偏离因子（LCPESW）表现较好，两个细分因子的近期表现如下：

我们对上述两个因子进行等权合成，对合成后因子进行行业市值中性化，得到的遗憾规避因子净值曲线如下：

可以看出，因子收益表现整体平稳向上，在样本外也体现出较强的超额收益水平。因子在上周、本月以来和今年以来的超额收益表现如下，今年以来表现良好，已取得9.24%的多头超额收益。

4. 斜率凸性因子

股票作为二级市场上被广泛交易的标的，其价格与供需量的变化受到供需弹性的规律影响。而高频快照数据中的限价订单簿所独有的委托量和委托价信息，为我们提供了绝佳的研究数据来源。我们首先将委托量数据按照其档位进行累加，用委托价和累计委托量计算出买卖双方的订单簿斜率。发现日频斜率因子基本符合我们的一般认知：即买方斜率越大，股票的需求弹性越小，买方投资者对于股票的价格敏感程度较低，则股票有更高的预期收益。对于卖方而言，斜率越小则股票的供给弹性越大，即减少相同的价格会有较大程度的委托量降低，表明卖方不愿轻易降价卖出，同样对应到股票更高的预期收益。

我们将按照订单所在档位区分为高档位投资者斜率因子和低档位斜率因子，并根据两者的反向关系构建出斜率凸性因子。最后提取出低档斜率因子（Slope_abl）和高档位卖方凸性因子(Slope_alh)进行合成。发现在周频的调仓频率上，两个细分因子的近期表现出现波动，具体表现如下：

我们对上述两个因子进行等权合成，对合成后因子进行行业市值中性化，得到的斜率凸性因子净值曲线如下：

可以看出，因子自2016年以来，收益保持平稳的趋势，因子在样本外整体表现也比较平淡。因子在上周、本月以来和今年以来的超额收益表现如下。

六、基于基本面因子与高频因子构建的中证1000指数增强策略表现

为考虑高频因子的实际选股表现，我们将上述三类高频因子等权合成构建了高频“金”组合中证1000指数增强策略。策略调仓频率为周度，手续费率为单边千分之二，基准为中证1000指数。为降低调仓手续费对策略的影响，我们加入换手率缓冲的机制降低调仓成本。策略的净值曲线及主要业绩指标如下：

可以看出，指数增强策略在样本外同样表现出色，有着较强的超额收益水平。策略在上周、本月以来和今年以来的超额收益表现如下。近几月以来出现阶段性调整，上周录得0.51%的超额收益，本月以来超额收益为2.02%，今年以来超额收益为6.48%。

一般而言，高频因子与传统基本面因子的相关性较低，将表现较好的基本面因子和高频因子进行结合能够有效提升多因子投资组合的表现，为此我们构建了基于多因子的高频&基本面共振组合中证1000指数增强策略。其中基本面因子包括：一致预期、成长和技术因子，高频因子为本篇报告上述的三类因子。策略的净值曲线及主要业绩指标如下：

可以看出，加入基本面因子后的指数增强策略的各项业绩指标均有一定程度提升。且在样本外表现稳定，有着较强的超额收益水平。策略在上周、本月以来和今年以来的超额收益表现如下。近期表现整体较好，上周录得1.57%的超额收益，本月以来超额收益为3.34%，今年以来超额收益为9.01%。

附录一：高频“金”组合中证1000指数增强策略本周持仓列表

附录二：高频&基本面共振组合中证1000指数增强策略本周持仓列表

风险提示

1、以上结果通过历史数据统计、建模和测算完成，在政策、市场环境发生变化时模型存在失效的风险。

2、策略依据一定的假设通过历史数据回测得到，当交易成本提高或其他条件改变时，可能导致策略收益下降甚至出现亏损。

往期报告

量化观市系列

主动量化系列

Alpha掘金系列

Beta猎手系列

智能化选基系列

量化漫谈系列

量化掘基系列

CTA金点子系列

年度投资策略

＋

报告信息

证券研究报告：《DeepSeek-V3发布，性能比肩头部模型》

对外发布时间：2024年12月30日

报告发布机构：国金证券股份有限公司

证券分析师：高智威

SAC执业编号：S1130522110003

邮箱：gaozhiw＠gjzq.com.cn

证券分析师：王小康

SAC执业编号：S1130523110004

邮箱：wangxiaokang＠gjzq.com.cn

点击下方阅读原文，获取更多最新资讯

量化智投

国金证券金融工程高智威团队。研究范围涵盖了量化选股、资产配置、基金研究以及衍生品投资等领域。