介绍arXiv 2023的一篇文章:Temporal Data Meets LLM - Explainable Financial Time Series Forecasting
本文的方法把财经文本、交易时间序列两类结构化与非结构化数据统一到大模型的应用框架中,进行股票收益率。大模型能捕捉到这两类时间序列的复杂关系,同时也避免了之前研究所进行的大量文本特征提取工作。在zero/few shot下能获得比传统模型好的结果,还是会令人难于相信。
问 题
预测股票收益率,并给出相应的解释。
数据及处理
纳斯达克NASDAQ-100股票(包括高通、苹果、谷歌等)+历史价格数据+公司元数据+历史经济金融新闻。处理方法是,价格数据转换成为收益率,量化为若干个桶(bin)并用Dx,Ux标注。桶的数量取决于预测精度要求。使用GPT4生成公司描述文本,以及对公司股价有影响的正负面因子,看起来是一般性描述,与日期没有关系。(图1)
使用Google搜索引擎API获得上市公司一周内的前5个新闻,并使用GPT-4生成摘要和关键词(图2)。对于每周的宏观经济和金融新闻也采用类似方法获得摘要和关键词。
进一步将这些摘要和关键词用GPT-4转换为一个精简的摘要和关键词。 (图3)
大模型
GPT-4
利用大模型的两个能力:[1] 大模型能发现复杂跨模态金融时序数据之间的复杂关系,这里的跨模态就包括了新闻信息、公司元数据、交易数据等。[2]大模型能生成可读性高的解释文本。
推理/预测
使用基于指令的提示进行zero-shot/few-shot推理,提示的结构(图4),但是时间序列量化的等级标签只是一个符号,在大模型自身的训练中可能有本来的含义,这里这样做倒是会让人不解。
思维链COT的的提示 (图5)
对比方法
-历史数据中出现最多的bin作为预测结果
-ARMA-GARCH
-树模型LightGBM
-公开的Open LLaMA 13B,使用5年历史数据进行指令微调
IntBigData
本号是复旦大学互联网大数据与安全课题组公号,主要推送AI、大数据与安全的相关技术应用,包括爬虫数据采集与对抗、大模型、人工智能安全、大数据分析与安全等。