记得戳上面的蓝字关注哦!
在学科的发展中,有莫伊夫、勒让德、拉普拉斯等对可靠性的不懈追求,也有高斯和勒让德对一个重要的方法最早创立权的纷争,也有如高尔顿这样大神的开创性工作、更有后来将理论与实践双结合,让数学成为统计的坚实基石的如费舍尔……
本文主要就会沿着这个主线进行陈述。先回顾下我们在上篇文章里提到的:18世纪统计中数据的可靠性成了一个大问题。
1、为解决数据的可靠性进行的努力
在1733年,在英国伦敦居住的法国人亚伯拉罕·德·莫伊夫,将我们现在称为正态曲线描述为二项分布的近似。
他利用这个想法对问题:如何可靠地推断出观察到的数据的某些特征,准确地反映了研究群体或现象的其他情形,进行解决。但是他并没有用这个二项式的相似很好地解决这个问题。
在整个18世纪,不少的人在研究概率论,这个最后以有着“法兰西牛顿”之称的数学家拉普拉斯在1812年出版发行了一本《概率分析理论》达到高点。
法兰西不仅仅有“法兰西牛顿”,还有阿德里安-马里·勒让德(1752年- 1833年),其研究深广程度与拉普拉斯比肩。尤其是勒让德提出了一种确立19世纪统计学走向的方法——“最小平方法”(我们的教材中也称其为最小二乘法)。
这个工具,从勒让德在1805年所写的一本关于彗星轨道研究的书的附录中提出,就成为了统计学中最为核心的标准工具之一。
最小平方法在误差之间建立了一种平衡,比较好滴揭示最接近被控制的系统的状态。
高斯(1777年4月30日–1855年2月23日)和拉普拉斯等人也各自独立地对勒让德的方法进行了证明,当然,证明用的是概率的方法,并用更加利于传播的方式进行了陈述,让其应用起来更加的容易。
随着勒让德的方法的传播,让大量数据处理研究非常有效。
高斯
从被拒绝到慢慢接受
比利时天文学家,数学家兰伯特·凯特勒(1796-1874),在1835年出版了一本书:《社会物理学》,在这个书中,他试图用概率定理等去研究人类的特征。尤其其中提出了“平均人”的概念,是不是有些熟悉?的确有个类似的概念:“经济人”——这个概念奠定了亚当·斯密《国富论》整个经济学体系的基本假设。
这个“平均人”的概念基于数据结构,去对特定情况下人的属性进行研究的一个新概念。这是全新的,开创性的,也是统计方法进入社会科学领域的第一次尝试。
这个概念在提出之初,很多人认为这是将数学的方法过度地扩展到人类行为,所以带来了很多的批评,在大多数科学领域遭到了无情的抗拒。
不过,心理学方面的研究者却非常接受这些方法。具体为何接受,原因未知;也许是因为可以控制数据的来源吧。
在19世纪末,已经成为心理学家的广泛接受和使用的工具了。
随着社会很多方面的进步,人们对科学处理数据的方法日益增加。加之心理学的接受和使用,让心理学的研究有了比较大的进步。
统计学逐渐地走出了被一个个学科拒绝的阴霾,成为了数学学科的一个小枝节。
3、高尔顿的开创性工作和影响
到了19世纪60年代,弗朗西斯·高尔顿爵士开始研究遗传问题时,统计学已经成熟了。
高尔顿,如下图所示,留着精致的络腮胡,下巴光光,脑袋谢顶、博学绅士的老帅哥:弗兰西斯·高尔顿(Francis Galton,1822年2月16日—1911年1月17日)。
“高尔顿比10个生物学家中的9个更懂数学和物理,比20个数学家中的19个更懂生物,而比50个生物学家中的49个更懂疾病和畸形儿的知识。”高尔顿的学术继承人、统计学家、心理学家皮尔逊用这么一段俏皮话来进行评价。
似乎这样不正式的评价让我们很难清楚他到底是怎样的人,我们再来看看他的很多个第一,就能了解他有多么的优秀。
第一个研究了遗传和后天教养对人的影响、;
第一个使用了调查问卷
第一个使用了词语联想测验
第一个进行双生子研究
第一个研究了表象
第一个进行了智力测验
第一个使用了相关统计技术。
第一个提出……
就这样的人,在智力上从孩童起就体现出了相当的过人。我们会认为,这样的人物,在求学学习过程中肯定是一骑绝尘,我辈凡人只能望其项背,他肯定是开挂般的存在了!
可惜,不是如此,虽然他智力超群,不过在后来读书时候曾为了成为一名优秀毕业生被困扰,甚至差点中断学业,这也许是在他中年以后进入心理学的研究有些许关联。
他的堂兄弟达尔文(查尔斯·罗伯特·达尔文(Charles Robert Darwin,1809年2月12日—1882年4月19日))发表了那本著名的《物种起源》里有个非常重要的观点:“物竞天择、适者生存”,这让高尔顿从堂兄弟对大自然的研究结论,推广至人类社会,提出了他自己非常重要的观点:人类的聪明和优秀通过遗传进化下去,所以智力和才能的出色是是可以遗传的,后来就致力于该想法的研究,进行了数据的收集、分析、归类、统计,来支持他的观点。并将这些观点在1869年的著作《天才的遗产》中进行了完整陈述。
达尔文
在这个研究中,有比较多的附属成果产生,比如为统计学等方面收集和分析数据提供了基础,为心理学的研究开拓了许多方法。例如问卷调查、心理测试、对双胞胎进行研究都是他发明的研究方法。
在研究父与子两代身高的关系时,根据收集到的1078对父亲及其儿子的身高数据,归纳提出了“回归效应”, 它反映了一个规律,即这两种身高父亲的儿子的身高,有向他们父辈的平均身高回归的趋势。
他通过观察这1078对夫妇的身高数据,以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高作为因变量,将儿子与父母身高的这种现象拟合出一种线形关系。
通过观察,高尔顿还注意到,尽管这是一种拟合较好的线形关系,但仍然存在非常极端的个案发生,比如身高偏矮的父母有非常高大的儿子,或者高大的父母有非常矮的儿子等。不过,当父母身高走向极端,子女的身高有取向平均身高的趋势,这就是统计学上最初出现“回归”的涵义,高尔顿把这一现象叫做“向平均数方向的回归” 。
4、后高尔顿时期以及最小二乘之争
在19世纪90年代,高尔顿的学术核心思想由爱尔兰数学家弗朗西斯·埃奇沃斯和伦敦大学的卡尔·皮尔森(就是文中开始评价高尔顿的),以及卡尔·皮尔森的学生乌德尼·尤勒完善和发展了。
卡尔·皮尔森
尤其是乌德尼·尤勒最终将高尔顿和皮尔森的思想发展成了一种有效的回归分析方法,并且使用了勒让德(你应该还记得文中开头提到的和法兰西牛顿拉普拉斯齐名的牛人)的“最小平方法”的变体,这位20世纪整个生物级社会科学广泛接受和使用统计进行数据的处理铺平了道路。
最小二乘,有一段小小的纠纷。勒让德与高斯两人就曾为谁最早创立最小二乘法原理发生过争执。
在1809年,高斯发表的著作《天体运动论》中,使用的最小二乘法的方法,而法国科学家勒让德于1805年独立发现“最小平方法”,但因勒让德并不为世人所知,而默默无闻。而享誉国内外的天才高斯,便获得了这个方法的绝大部分功劳,而且在1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明,核心证明的思想体现在了高斯—马尔可夫定理(Gauss–Markov theory)这个定理给出了在线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。更让大家将“最小二乘法”和高斯这个大IP紧紧捆绑在了一起。
然而,最小二乘估计法是实际上由阿德里安-马里·勒让德(Adrien-Marie Legendre)首先发表在1805年。
5、费舍尔让统计更加强大
统计理论渐趋成熟,其适用性越来越明显,20世纪最重要的统计学家,Ronald Fisher(罗纳德·费希尔:1890-1962),凭借自己在理论和实践两方面的深邃的洞察力,将统计学转化为基于坚实数学基础的强大科学工具,也被誉为现代统计科学的奠基人之一。
罗纳德·费希尔也是达尔文进化论的继承者,用统计学方法对达尔文进化论作了基础澄清的工作。也有人认为费希尔是是“达尔文最伟大的继承者”。
1925年费希尔出版了《研究者的统计方法》,10年后,又出版了一本关于获得数据,如何设计实验的数《实验设计法》以期从根本上来解决数据获取的可靠性。
费舍尔的工作,让统计工具成为任何学科研究中,优先会应用到的工具。
时至今日,统计技术被应用到越来越多人类事务中,政治中的民意调查、教育中的标准化考试、学术研究、日常生活、个人消费、运动等行为;企业中的生产经营等。
比如企业的管理运营中,企业发展战略的确定,就需要了解把握整个宏观经济状况的变化和市场的微观变化,都离不开统计,需要统计设计相应的量表以获得可靠的数据吗,用统计方法进行科学分析和预测等;在产品质量管理中也可以应用统计来进行检测控制等、比如我们非常熟悉的6西格玛准则;在市场研究和财务分析中更是大量应用到统计方法。人力资源中用统计方法对员工的年龄、性别、受教育程度、工资等进行分析,为企业制定各类工资、奖金、福利以及惩处制度提供依据……
统计的应用领域,我采用人大出版社,贾俊平、何晓群以及金勇进编写的《统计学》中的量表。大家可以清楚的看到统计技术和方法应用在了众多的学科领域之中。
六、结语
统计学发展至今日,AI和大数据模型、人工智能等的发展,更是让统计技术和方法(如探索性数据分析方法)变得越来越重要。
统计学虽然脱胎于数学,也曾经是数学的一个枝节。今天,已经不再是数学的一个分支,这个运用逻辑和方法,测定不确定性度、规划和解释实验过程中检验不确定性后果的学科,已经成为了一门独立的学科。
统计学也有着自己的独特性,以及目标、标准,也对这个社会产生着深远而重要的影响。
参考书籍:
笹部贞市郎.2015.《这才是最好的数学书》[M].[北京]北京时代华文书局。
比尔·伯林霍夫、费尔南多·辜维亚.2019.《Math Through The Ages:A Gentle History for Teachers and Others》[M].[北京]北京时代华文书局
点击关注,领取皮爸精心为您准备的学习的见面礼包!
往期好文阅读
更多往期精彩内容请点击相关阅读链接:
18.从高中课本点到直线距离证明,略谈对公式证明的思考和学习
点在看,获得更多内容~~
end