Kaggle最新量化大赛来了-Jane Street实时市场预测大赛
最近Jane Street又在kaggle出了一个量化预测大赛,做量化的朋友可以看看。
1. 赛题描述
在现代金融市场中处理建模问题时,有很多理由让人觉得你试图解决的问题几乎是不可能的。即使你抛开金融工具的价格理性反映所有可用信息的信念,你仍然需要面对时间序列和分布,这些在其他类型的建模问题中是无法遇到的。分布可能会非常厚尾,时间序列可能是非平稳的,而数据通常无法满足许多成功的统计方法所依赖的基本假设。再加上金融市场最终是一个涉及大量个人和机构的人类活动,这些机构随着技术进步和社会变革而不断变化,并对经济和地缘政治问题的出现作出反应——你就能开始感受到其中的困难了!
在这个挑战中,我们要求你使用来自我们一些生产系统的真实数据构建一个模型。这些数据非常贴近我们每天在现代金融市场交易成功所需做的一些事情。我们汇集了一系列与我们运行自动化交易策略的市场相关的特征和响应者,并且我们非常关注拥有良好的基础模型。为了平衡打造一个具有挑战性且与我们业务相关的问题,同时尊重我们交易的专有性和高度竞争性,你会注意到我们对一些特征和响应者进行了匿名化和轻微模糊处理。这些修改并没有改变问题的本质,但确实让我们能够给你一个有挑战性的任务,真实地展示我们在Jane Street所做的工作。
Jane Street在交易的各个方面不断创新,已经有几十年的历史,并建立了机器学习模型来帮助我们的决策。这些模型帮助我们每天在全球200多个交易场所积极交易数千种金融产品。虽然这个挑战只呈现了Jane Street员工每天所处理的定量问题的一小部分,但我们非常希望看到Kaggle社区将如何应对这个挑战,并与你们讨论你们的解决方案!
2. 评估
提交的评估是基于一个分数函数,该函数被定义为样本加权的零均值R平方分数。
3. 赛题数据
竞赛数据集包含一组时间序列,具有79个特征和9个responders,经过匿名处理,但代表真实的市场数据。竞赛的目标是预测其中一个responder,即responder_6,最长可预测六个月的未来。
4. 竞赛阶段数据描述
根据预测任务,比赛将分为两个阶段:
一个模型训练阶段,使用一组历史数据作为测试集。这个测试集大约有450万行数据。一个预测阶段,测试集将在提交结束后收集。你可以预期这个测试集的规模与第一阶段的测试集相当。为了帮助你提交更强的作品,在模型训练阶段的最后几周,我们将扩展公共测试集,包含更接近提交截止日期的数据。对这个扩展集的预测将不计分。
在预测阶段开始时,未计分的公共测试集将扩展到模型训练阶段的最后一天,私有集大约每两周更新一次。每次更新时,提交将重新计分。
在预测阶段,评估API将提供从公共集开始到私有集结束的测试数据。你必须在每个时间步进行预测,但在这个阶段,只有对私有集的预测会被计分。(如果你愿意,你可以在未计分的部分预测0.0。)
本文我们汇总Kaggle和金融相关的竞赛,如果对金融量化建模的小伙伴学习和参考。如有遗漏,欢迎留言补充。
1. JPX Tokyo Stock Exchange Prediction
1.1 比赛连接
https://www.kaggle.com/competitions/jpx-tokyo-stock-exchange-prediction
1.2 方案分享
参见官网
2. Ubiquant Market Prediction
2.1 比赛连接
https://www.kaggle.com/competitions/ubiquant-market-prediction
2.2 方案分享
参见官网
3. Optiver Realized Volatility Prediction
3.1 比赛连接
https://www.kaggle.com/c/optiver-realized-volatility-prediction
3.2 方案分享
[1st place] - https://www.kaggle.com/competitions/optiver-realized-volatility-prediction/discussion/274970 [2nd place] - https://www.kaggle.com/c/optiver-realized-volatility-prediction/discussion/274970 [3rd place] - https://www.kaggle.com/competitions/optiver-realized-volatility-prediction/discussion/278588 [12th place] - https://www.kaggle.com/c/optiver-realized-volatility-prediction/discussion/275169 [20th place] - https://www.kaggle.com/c/optiver-realized-volatility-prediction/discussion/275543 [23rd place] - https://www.kaggle.com/c/optiver-realized-volatility-prediction/discussion/275140 [32nd place] - https://www.kaggle.com/c/optiver-realized-volatility-prediction/discussion/275806 [37th place] - https://www.kaggle.com/c/optiver-realized-volatility-prediction/discussion/275473
4. Jane Street Market Prediction
4.1 比赛连接
https://www.kaggle.com/competitions/jane-street-market-prediction/overview
4.2 方案分享
[1st place] - https://www.kaggle.com/c/jane-street-market-prediction/discussion/224348 [3rd place] -https://www.kaggle.com/c/jane-street-market-prediction/discussion/224713 [23rd place] - https://www.kaggle.com/c/jane-street-market-prediction/discussion/224079 [39th place] - https://www.kaggle.com/c/jane-street-market-prediction/discussion/224029 [44th place] - https://www.kaggle.com/c/jane-street-market-prediction/discussion/227167
5. The Winton Stock Market Challenge
5.1 比赛连接
https://www.kaggle.com/c/the-winton-stock-market-challenge
5.2 方案分享
[Solution Sharing] - https://www.kaggle.com/c/the-winton-stock-market-challenge/discussion/18584
6. Two Sigma Financial Modeling Challenge
6.1 比赛连接
https://www.kaggle.com/c/two-sigma-financial-modeling
6.2 方案分享
[7th place] - https://www.kaggle.com/c/two-sigma-financial-modeling/discussion/29793 [10th place] - https://www.kaggle.com/code/phegde/team-pradeep-arthur-private-lb-10-solution/comments [12th place] - kaggle.com/competitions/two-sigma-financial-modeling/discussion/29518
7. Two Sigma: Using News to Predict Stock Movements
7.1 比赛连接
https://www.kaggle.com/c/two-sigma-financial-news/overview
7.2 方案分享
无
8. The Big Data Combine Engineered by BattleFin
8.1 比赛连接
https://www.kaggle.com/c/battlefin-s-big-data-combine-forecasting-challenge