在量化投研的普通研发流程中,一个有效策略的上线,要经历数据清洗、特征工程、因子评价、策略回测、代码转写、结果校验等多个阶段,才能最终投入实盘运行。
在这个流程中,因子挖掘或者特征工程往往需要大量计算资源,随着涉及的数据量增大或研究频率增高,以 python 为主流的因子计算框架通常会成为效率提升的瓶颈。
另一个让众多量化研究者头疼的耗时环节,无疑就是策略回测。回测作为策略上线前的“质检环节”,其重要性无需多言。但在一些中高频策略研究中,回测耗时轻则数小时,动辄一两天,大大影响了研究的效率。
除了性能瓶颈这个通病,中高频的策略回测还面临几个主要挑战:
首先,中高频策略对于交易的细节非常敏感,研究员们需要考虑决策时间点、成交价、手续费流动性等模拟撮合和市场成交情况,如果缺失细节的设计,策略回测和实盘交易的表现就会有很大差异。
其次,在使用历史数据进行回测时,计算信号以批处理的逻辑实现,但策略在实盘中运行时,往往需要以事件驱动的流式处理来应对实时更新的行情。因此对于同一套策略的验证与上线,就需要编写流和批两套框架,不仅耗时且容易出错。
最后,中高频策略回测涉及到的数据量十分庞大,历史数据通常在 TB 级别;与此同时,在设计高频策略时,通常还会采用一些指标、模型或机器学习方法来辅助判断市场的趋势;也往往会基于不同事件,如新行情、订单成交来开发对应策略。这对系统的性能和开发便利性都提出了很大的挑战。
工具的选择
量化投研从业者对 DolphinDB 这个工具应该都不陌生。作为一个专为量化投研交易设计的数据平台,DolphinDB 不仅有着超高性能,同时还内置了大量由“引擎、函数、模块、插件”四类专业开发工具构成的业务中间件,大幅提升量化投研的整体效率。目前,国内头部金融机构几乎都已将 DolphinDB 作为投研工具,用于因子计算加速等场景,将策略上线周期从数月缩短至数周。
11 月 5 日(本周二)19:30,DolphinDB 将在线上直播,正式发布其开发的中高频策略回测框架。直播包含对模拟撮合和回测框架的详细介绍、与市面产品的性能测试对比以及期货分钟频 CTA、股票高频、科创板做市实战案例分享等干货硬核内容。
👇扫描海报二维码报名👇
DolphinDB 回测框架由数据回放、模拟撮合引擎、回测引擎三部分组成。框架底层基于 C++ 优化,还支持启用 JIT 技术,性能较 python 回测框架快 10 到 100 倍。在模拟撮合时,它能够处理逐笔委托、成交等不同类型的行情数据,确保“价格优先,时间优先”的撮合原则。用户还可以根据自身需求灵活调整参数配置。而且,此框架支持的回测品种包括沪深股票、基金和可转债、银行间债券、各大期货交易所的期权和期货、以及外汇与数字货币。
Starfish 因子开发管理平台
点击“阅读原文”,报名直播~