聊聊期权量化 - 2 - 搭建本地化期权数据库

文摘   财经   2024-05-31 09:22   上海  
确认数据需求

本文是《聊聊期权量化》系列的第二篇,让我们先回顾一下本系列计划探讨的主题:

  1. 期权策略投研中的难点(已探讨)
  2. 搭建本地化期权数据库(本文主题)
  3. 期权策略的开发和回测
  4. 实盘期权策略交易运维

在上一篇文章中,我们探讨了期权策略回测过程中潜在的主要难点,并强调了数据管理的重要性。具体而言,我们需要:

  • 构建并持续维护一个全面的期权历史合约信息数据库,确保每个交易日的合约信息准确无误;

  • 为每个期权品种准备包含所有历史合约(包括当前和过往合约)的K线数据库,以便进行完整的历史数据回放。


迅投研数据准备

在明确了需求之后,我们决定采用【迅投研】数据服务来构建我们的本地期权投研数据库。对于迅投研的基本使用方法,可以参考我们公众号之前发布的《基于迅投研的量化数据自运维下载更新》一文

整个期权数据的下载流程可以简化为以下三个关键步骤:

  1. 更新迅投研本地缓存中的历史合约信息表;

  2. 更新VeighNa Elite数据库中的期权合约数据;
  3. 更新VeighNa Elite数据库中的期权K线数据。

本文中所提供的代码,需要通过VeighNa Elite Lab交互式开发环境来运行。首先在全局配置SETTINGS中填入迅投研的账号token

from multiprocessing import Processfrom datetime import datetime
from vnpy.trader.database import BarOverviewfrom vnpy.trader.datafeed import get_datafeedfrom vnpy.trader.object import ContractData, BarData, HistoryRequestfrom vnpy.trader.constant import Exchange, Product, OptionType, Intervalfrom vnpy.trader.setting import SETTINGS
from elite_database import EliteDatabase

# 配置迅投研数据服务SETTINGS["datafeed.name"] = "xt"SETTINGS["datafeed.username"] = "token"SETTINGS["datafeed.password"] = ""

由于迅投研和VeighNa在交易所命名规则上存在差异,因此我们需要对两边的交易所进行对应关系映射

# 交易所映射关系EXCHANGE_XT2VT = {    "SH": Exchange.SSE,    "SZ": Exchange.SZSE,    "BJ": Exchange.BSE,    "SF": Exchange.SHFE,    "IF": Exchange.CFFEX,    "INE": Exchange.INE,    "DF": Exchange.DCE,    "ZF": Exchange.CZCE,    "GF": Exchange.GFEX}

迅投研的客户端库xtquant仅在每次启动时会从硬盘文件中读取历史合约信息表,且在后续的进程运行期间不会自动读取更新。为了确保历史合约信息表的更新能够即时反映这里需要使用multiprocessing多进程库在子进程中执行update_history_data函数

def update_history_data() -> None:    """更新历史合约信息"""    # 在子进程中加载xtquant    from xtquant.xtdata import download_history_data
# 初始化数据服务 datafeed = get_datafeed() datafeed.init()
# 下载历史合约信息 download_history_data("", "historycontract")
print("xtquant历史合约信息下载完成")

下一步将进行一个关键步骤——下载并更新期权合约数据这一步骤对于后续的期权投研和回测至关重要。在处理期权合约对象ContractData时,特别要注意所有以option_为前缀的字段,确保这些字段信息准确无误且完整,避免任何错误或遗漏:

def update_contract_data(sector_name: str) -> None:    """更新合约数据"""    # 在子进程中加载xtquant    from xtquant.xtdata import (        get_stock_list_in_sector,        get_instrument_detail    )
# 初始化数据服务 datafeed = get_datafeed() datafeed.init()
# 查询中金所历史合约代码 vt_symbols: list[str] = get_stock_list_in_sector(sector_name)
# 遍历列表查询合约信息 contracts: list[ContractData] = []
for xt_symbol in vt_symbols: # 拆分XT代码 symbol, xt_exchange = xt_symbol.split(".")
# 筛选期权合约合约 if "-" in symbol: data: dict = get_instrument_detail(xt_symbol, True)
type_str = data["InstrumentID"].split("-")[1] if type_str == "C": option_type = OptionType.CALL elif type_str == "P": option_type = OptionType.PUT
option_underlying: str = data["InstrumentID"].split("-")[0]
contract: ContractData = ContractData( symbol=data["InstrumentID"], exchange=EXCHANGE_XT2VT[xt_exchange.replace("O", "")], name=data["InstrumentName"], product=Product.OPTION, size=data["VolumeMultiple"], pricetick=data["PriceTick"], min_volume=data["MinLimitOrderVolume"], option_strike=data["ExtendInfo"]["OptExercisePrice"], option_listed=datetime.strptime(data["OpenDate"], "%Y%m%d"), option_expiry=datetime.strptime(data["ExpireDate"], "%Y%m%d"), option_underlying=option_underlying, option_portfolio=data["ProductID"], option_index=str(data["ExtendInfo"]["OptExercisePrice"]), option_type=option_type, gateway_name="XT" ) contracts.append(contract)
# 保存合约信息到数据库 database: EliteDatabase = EliteDatabase() database.save_contract_data(contracts)
print("合约信息更新成功", len(contracts))

鉴于期权K线数据总量巨大且涉及众多合约加之数据服务每日提供的流量有限因此除了初次下载采用全量模式外,后续更新应采用增量模式

  • 仅更新那些尚未到期的期权合约的K线(已到期的不会再发生变化)
  • 从本地已有数据的末端开始向后更新(避免重复下载已存在的部分)

以下代码中,默认的查询开始时间参数start设置为2018-1-1,可以根据自己的实际需求进行调整(通常来说已能满足需求):

def update_bar_data() -> None:    """更新K线数据"""    # 初始化数据服务    datafeed = get_datafeed()    datafeed.init()
# 获取当前时间戳 now: datetime = datetime.now()
# 获取合约信息 database: EliteDatabase = EliteDatabase() contracts: list[ContractData] = database.load_contract_data()
# 获取数据汇总 data: list[BarOverview] = database.get_bar_overview()
overviews: dict[str, BarOverview] = {} for o in data: # 只保留分钟线数据 if o.interval != Interval.MINUTE: continue
vt_symbol: str = f"{o.symbol}.{o.exchange.value}" overviews[vt_symbol] = o
# 遍历所有合约信息 for contract in contracts: # 如果没有到期时间,则跳过 if not contract.option_expiry: continue
# 查询数据汇总 overview: BarOverview = overviews.get(contract.vt_symbol, None)
# 如果已经到期,则跳过 if overview and contract.option_expiry < now: continue
# 初始化查询开始的时间 start: datetime = datetime(2018, 1, 1)
# 实现增量查询 if overview: start = overview.end
# 执行数据查询和更新入库 req: HistoryRequest = HistoryRequest( symbol=contract.symbol, exchange=contract.exchange, start=start, end=datetime.now(), interval=Interval.MINUTE )
bars: list[BarData] = datafeed.query_bar_history(req)
if bars: database.save_bar_data(bars)
start_dt: datetime = bars[0].datetime end_dt: datetime = bars[-1].datetime msg: str = f"{contract.vt_symbol}数据更新成功,{start_dt} - {end_dt}" print(msg)

最后,在脚本的主入口处(或在Jupyter Notebook中),按照既定顺序依次调用并执行上述所有函数

if __name__ == "__main__":    # 使用子进程更新历史合约信息    process: Process = Process(target=update_history_data)    process.start()    process.join()      # 等待子进程执行完成
# 更新合约信息 update_contract_data("中金所") update_contract_data("过期中金所")
# 更新历史数据 update_bar_data()

需要注意的是,目前迅投研的14天试用权限已不再提供期权数据,需要购买正式权限后才能下载使用,不过其4978元/年的价格覆盖股票、期权、期货等多种数据,在同类产品中性价比还是颇具竞争力





你对于期权回测数据的准备策略的开发有什么疑问,或者希望在后续文章中看到的内容?欢迎在评论区留言告诉我们!!!






免责声明
文章中的信息或观点仅供参考,作者不对其准确性或完整性做出任何保证。读者应以其独立判断做出投资决策,作者不对因使用本报告的内容而引致的损失承担任何责任。

VeighNa开源量化
VeighNa官方公众号。免责声明:本公众号内的文章旨在为更多想要学习Python的学员提供帮助,VeighNa管理者及运营者不对任何利用VeighNa社区或相关软件技术直接或间接从事违反中国法律以及社会公德的行为负责。
 最新文章