进入21世纪,以数字经济为代表的第四次产业革命深刻地影响着人类的生产生活方式。基于互联网、移动互联网和人工智能技术的金融科技为各类投资者进行金融交易和资产管理提供了广泛的途径和便利的手段,同时,也产生了海量的金融大数据需要进行分析。
金融数据的魅力无穷,并不遵从简单的模型。金融数据不可预测,也不受物理法则支配。金融数据是“大数据”。
现在获得金融数据和进入金融市场的方法,与50多年前相比,发生了非常大的变化。以大家都熟悉的股市为例,以前对于一般的投资者和交易者来说,几乎不存在期权市场,也没有上市期权(1973年才出现上市期权),对冲机会非常有限。那时也没有ETF市场(ETF最早的形式在1989年才出现,于一年后退市;后来,1993年推出第一个ETF“标普500存托凭证(Spider或SPDR)”)。多数共同基金都进行“主动管理”,收费很高。
让我们来一次有趣的回顾。美国金融市场经历了20世纪60年代的繁荣期,随后处于长期的萧条期(除了1975年的强劲反弹外)。直到1982年,道琼斯指数收盘价才稳定在1 000点以上。从1999年开始,除了两次暴跌外,道琼斯指数都在万点以上。20世纪80年代和90年代,道琼斯指数走势为一个方向:向上!由于“互联网泡沫崩溃”造成了严重的影响,道琼斯指数跌回万点以下。不只是互联网公司,几乎所有公司股价都下跌。随后,重回涨势,直到金融危机引起暴跌,道琼斯指数再次跌回万点以下。2018年初,道琼斯指数处于历史上低波动时期,突破26 000点,随后两年内,达到29 000点。没有人理解这样的波动性,但是许多交易者(特别是“精明的投资者”)都通过交易波动率赚了钱,直到他们的交易突然亏了很多钱。同样,没有人弄明白2018年圣诞前夜的暴跌(尽管许多分析师做了“解释”),但是那些冒险抄底的人在新的一年大赚了一笔。我们曾经相信金融数据生成过程是理性的,但是和其他交易者一样,现在我们知道该过程并不是理性的。这恰好使得我们对金融数据分析更有兴趣。数据生成过程本身就会引起人们的兴趣,观察到它很开心,这也是我们进行金融数据分析的原因。
对于输入方式,开始是手工输入数据,直到20世纪90年代某个时候使用Fortran;随后在2000年左右使用电子表格程序;后来,使用R。
本书是著名统计学家詹姆斯·E.金特尔面对新的形势撰写的一本金融数据统计分析教材《金融数据统计分析:基于R语言实例》。
詹姆斯·E.金特尔曾任乔治·梅森大学计算统计学教授,是美国统计协会、美国科学促进会、英国皇家统计学会等多个学术机构的成员。他曾担任The American Statistician(1989—1990)的副主编,以及多个计算统计学期刊的编辑,目前担任Communications in Statistics的资深编辑。他主要从事计算统计、模拟、计算金融等方面的研究,已经出版了多本统计相关书籍。
该书将金融数据、统计方法和R软件密切结合。书中首先对金融市场、金融资产和交易机制进行了简单、清晰的介绍,以帮助读者正确地理解金融数据的生成过程,为进行金融数据统计分析奠定基础;其次,以目前金融数据统计分析使用的基本方法为基准,介绍了概率论、数理统计、时间序列分析的基本概念和基本方法,并且侧重于金融数据的应用;最后,在对R语言进行介绍的基础上,给出了实例的计算程序,提供了数据链接,读者可以下载计算,从而加深对统计分析方法的了解和掌握。因此,尽管金融数据的统计分析方法非常复杂,但是读者通过学习本书的内容,特别是通过实例练习,可以很容易地掌握和应用这些复杂的统计方法。
《金融数据统计分析:基于R语言实例》
书号:9787111758174
定价:139.00元
著名统计学家撰写
统计方法与R软件实现紧密联系,自成体系
推荐理由:
本书是著名统计学家James E. Gentle撰写的金融数据统计分析教材,结合金融数据的特点,把统计方法与R软件实现紧密联系,自成体系,即有对统计学、计量经济方法原理的介绍,又有各种具体的应用实例、程序代码,还列出了供读者深入学习的参考文献和注释说明。
本书涵盖了使用统计分析和数据科学方法对财务数据进行建模和分析的方法。第1章概述了金融市场,描述了市场运作并使用探索性数据分析来说明金融数据的性质。第2章介绍了探索性数据分析的方法,尤其是图形方法,并在实际财务数据上进行了说明。第3章介绍了可用于财务分析的概率分布,特别是重尾分布,并介绍了计算机模拟财务数据的方法。第4章介绍了统计推断的基本方法,尤其是在分析中使用线性模型,第5章介绍了时间序列的方法,其中特别强调了适用于财务数据分析的模型和方法。附录还描述了如何使用R从互联网获取当前财务数据。
不管是金融数据统计分析的初学者,还是有一定统计和计量分析基础的读者,都可以从阅读和学习本书中获益良多。
❖
—————译者简介 ————
东北财经大学经济学院数量经济系副教授,辽宁省数量经济学会理事。目前主要从事金融数据建模和预测、货币政策和资产市场方面的研究。主持过多项国家级、省级项目,译有多本金融统计类书籍。
上下滑动查看译者序
前言
第1章 金融数据的性质1
1.1 金融时间序列3
1.1.1 自相关系数5
1.1.2 平稳性5
1.1.3 时间尺度和数据加总6
1.2 金融资产和市场9
1.2.1 市场和监管机构11
1.2.2 利息14
1.2.3 资产收益率20
1.2.4 股票价格、公平市场价值23
1.2.5 股票分割、股利和资本收益32
1.2.6 指数和“市场”34
1.2.7 衍生资产43
1.2.8 空头头寸45
1.2.9 资产的投资组合:分散和
对冲46
1.3 收益率的频率分布53
1.3.1 位置和尺度55
1.3.2 偏度56
1.3.3 峰度57
1.3.4 多元数据57
1.3.5 正态分布61
1.3.6 q-q图64
1.3.7 异常值66
1.3.8 其他统计度量方法66
1.4 波动率69
1.4.1 收益率的时间序列69
1.4.2 度量波动率:历史波动率和隐含
波动率72
1.4.3 波动率指数:VIX76
1.4.4 隐含波动率曲线78
1.4.5 风险评估与管理79
1.5 市场动态83
1.6 关于金融数据的典型事实89
注释和深入阅读90
练习和复习题92
附录A1:使用R获取和分析金融
数据95
第2章 金融数据的探索性分析141
2.1 数据缩减142
2.1.1 简单概括统计量142
2.1.2 数据中心化和标准化143
2.1.3 多元数据的简单概括统计量143
2.1.4 变换143
2.1.5 识别异常观察值145
2.2 经验累积分布函数145
2.3 概率密度的非参数估计149
2.3.1 分箱数据149
2.3.2 核密度估计150
2.3.3 多元核密度估计量152
2.4 探索性分析中的图形法152
2.4.1 时间序列图153
2.4.2 直方图153
2.4.3 箱线图154
2.4.4 密度图155
2.4.5 二元数据156
2.4.6 q-q图157
2.4.7 R中的图形161
注释和深入阅读165
练习165
第3章 可观察事件模型使用的概率
分布169
3.1 随机变量和概率分布170
3.1.1 离散随机变量171
3.1.2 连续随机变量174
3.1.3 随机变量的线性组合:期望和
分位数177
3.1.4 生存函数和风险函数178
3.1.5 多元分布178
3.1.6 多元分布中变量之间的
相关性180
3.1.7 连接函数183
3.1.8 多元随机变量的变换185
3.1.9 顺序统计量的分布186
3.1.10 渐近分布:中心极限定理187
3.1.11 概率分布的尾部189
3.1.12 随机变量序列:随机过程192
3.1.13 股票价格的扩散过程与期权
定价193
3.2 一些有用的概率分布195
3.2.1 离散分布196
3.2.2 连续分布197
3.2.3 多元分布204
3.2.4 对建模有用的一般分布族205
3.2.5 构造多元分布215
3.2.6 数据生成过程建模216
3.2.7 概率分布的R函数216
3.3 随机变量的模拟219
3.3.1 均匀随机数219
3.3.2 生成非均匀随机数220
3.3.3 在R中模拟数据223
注释和深入阅读225
练习226
第4章 统计模型与推断方法232
4.1 统计模型232
4.1.1 拟合统计模型235
4.1.2 变差的度量和分解236
4.1.3 线性模型237
4.1.4 非线性方差稳定化变换239
4.1.5 参数模型和非参数模型239
4.1.6 贝叶斯模型240
4.1.7 时间序列模型240
4.2 统计建模的标准与方法240
4.2.1 估计量及其性质240
4.2.2 统计建模方法242
4.3 统计建模的优化:最小二乘法和
最大似然估计法248
4.3.1 一般优化问题248
4.3.2 最小二乘法252
4.3.3 最大似然法258
4.3.4 处理优化问题的R函数260
4.4 统计推断261
4.4.1 置信区间263
4.4.2 检验统计假设265
4.4.3 预测268
4.4.4 贝叶斯模型推断268
4.4.5 再抽样方法:自助法273
4.4.6 稳健统计方法275
4.4.7 尾部指数的估计277
4.4.8 风险值和预期损失的估计280
4.5 描述变量之间关系的模型283
4.5.1 主成分284
4.5.2 回归模型287
4.5.3 线性回归模型290
4.5.4 线性回归模型:回归变量293
4.5.5 线性回归模型:单个观察值和
残差297
4.5.6 线性回归模型:例子303
4.5.7 非线性模型313
4.5.8 在R中指定模型317
4.6 评估模型的充分性318
4.6.1 拟合优度检验;正态性检验318
4.6.2 交叉验证323
4.6.3 模型选择和模型复杂性327
注释和深入阅读328
练习330
第5章 离散时间序列模型及
分析338
5.1 基本线性运算343
5.1.1 后移算子344
5.1.2 差分算子345
5.1.3 积分算子347
5.1.4 无限几何序列求和348
5.1.5 线性差分方程348
5.1.6 趋势和去趋势351
5.1.7 周期和季节性调整353
5.2 离散时间序列模型分析354
5.2.1 平稳性357
5.2.2 样本自协方差和自相关函数:
平稳性和估计360
5.2.3 平稳时间序列中的统计推断363
5.3 自回归和移动平均模型366
5.3.1 移动平均模型:MA(q)367
5.3.2 自回归模型:AR(p)371
5.3.3 偏自相关函数380
5.3.4 ARMA和ARIMA模型383
5.3.5 ARMA和ARIMA模型的
模拟387
5.3.6 ARMA和ARIMA模型的统计
推断389
5.3.7 ARIMA模型阶数选择391
5.3.8 ARIMA模型预测391
5.3.9 R中ARMA和ARIMA模型的
分析392
5.3.10 ARMA过程的稳健性:服从
厚尾分布的新息395
5.3.11 金融数据397
5.3.12 带有ARMA误差的线性
回归398
5.4 条件异方差402
5.4.1 ARCH模型402
5.4.2 GARCH模型和扩展405
5.5 单位根和协整408
5.5.1 伪相关:相关系数的分布408
5.5.2 单位根413
5.5.3 协整过程418
注释和深入阅读421
练习422
参考文献429
温馨提示:点击文中封面可购买,链接仅供参考。
编辑:周睿
审核:刘慧、姚蕾