之前我在知乎上回答过一个有关统计学是不是一门独立学科的问题,当时大致地写了一些自己的看法。实际上,这个问题从我进统计系的第一刻开始就一直在头脑中萦绕了,在写完那个答案后自己也一直在思考在答案中提到的几个说法。今天这篇文章就展开来聊聊这个问题,有兴趣的也可以去知乎原问题看其他人的回答。
我并不打算通过一个比较学术的方式,给出“独立学科”的严格定义,然后去审查统计学这个知识体系是否符合“独立学科”的诸多标准。我想通过讨论这样一个问题:为什么统计学那么容易不被人当作一个独立学科?来讨论统计学到底是不是一门独立学科。
(一)
首先,一个学科的独立性要想得到人们的承认,那么首先需要长久存在一群一直做这一学科的人,而统计学的独立性要想得到认可,我们就需要经常性看到一群统计学家活跃在大众的视野中。为何这一点如此重要呢?稍微有过了解的人都知道,中国在偏社会科学的领域,发展得很差,但是这不妨碍大众把心理学,社会学,管理学等等学科认知为某个独立的学科,实际上大众并不知道这些学科的具体内容是什么,但是我们总是能在电视和互联网上见到某某著名的心理学家,社会学家等等,这就很有助于这些学科的独立性获得外行人的认同。
相反,作为统计学的行内人,如果你让我说出几个国内的统计学家,我的大脑第一反应是完全空白的,更别提活跃在公众视野里的,有名的统计学家。同时,如果细究一下,大多数对统计学发展作出奠基性贡献的西方统计学家,他们在中国社会的知名度也远远不及很多其他学科的奠基式人物。我们再次以心理学为例,你跑去大街上随便找个路人,99%的概率他会知道弗洛伊德是个心理学家,如果稍微有一些阅读习惯,他可能还知道马斯洛,罗杰斯等等这号人物。但如果你问他Ronald Fisher或者Karl Pearson是谁,除非是学过统计的,不然很有可能从未听过这些名字。
我们甚至还可以做个对比,在西方,统计学的学科独立性认可度在公众范围内是相对比较高的,因为大多数西方发达国家有比较成熟和完善的统计学家的社区。C.R.Rao在他的《统计与真理》(Statistics and Truth)一书的第二章中聊过统计学在欧洲最早是如何发端的。
首先,Statistics这个词最早于18世纪末被人们所采用,它的词根是state,所以Statistics的本意是一门用来描述世界当下状态的学问。C.R Rao把第一位应用统计学的美名归功于比利时数学家Adolphe Quetlet(1796年出生于根特),这个人直接促成了如今在英国享有盛誉的Royal Society of Statistics在1834年的成立,以及1854年在布鲁塞尔举行的第一届国际统计大会(the First International Statistical Congress)。这届统计大会由来自26个国家的153名代表参加,也直接推进了各个国家成立自己的中央统计局(法国早在1800年就成立了自己的中央统计局,是世界上最早的国家统计局)。再往后,由于统计学的实际需求的存在,这一统计大会被延续,现在被熟知的ISI(International Statistical Institute)也于1885年成立,其总部目前位于荷兰海牙的中央统计局中(明年的世界统计大会也会在海牙召开)。
从宏观上,我们可以看到早在19世纪上半叶,统计学已经在所谓的西方精英阶层中有了极其活跃的发展。而今天,Statistician在西方社会中已经是一个比较日常的词了,你登上Linkedin或者X(原Twitter),可以看到大量活跃着的,以Statistician自称的统计学家们。在这样的一种环境中,在公众层面,统计学作为一门学科,其独立性是很容易得到承认的。
(二)
刚刚聊了下在公众层面,统计学的独立性为何不太容易得到认可。但实际上在中文的学术圈里,都存在着“统计学的独立性是存疑的”这样的论调。当然,这一论调主要由很多数学研究者们发扬光大,或许你有看到过那么些说法:在数学家们的眼里,统计学就是玩具,又或者统计学是剩给研究不了理论数学的人的剩饭。从这些说法里我们可以看到,大家似乎很容易地把统计学想象成数学的一个分支。
这种想法其实是很容易理解的,因为我自己曾经也这样怀疑过。很多人会说统计学的内容和所谓的概率论(也就是数学中和统计学相关的那部分)是不一样的,一个是归纳,一个是演绎。但这种区别没啥用,因为事实是,你让一个能够做好演绎(概率论)的人来学归纳(统计学)的东西,那简直就是砍瓜切菜——统计学最早是靠数学家们发展起来,而纯统计学本身在数学面前,就好像一个远远不如老爸的富二代,真的没啥可以夸耀的“独立成分”,所以也就很难获得其学科独立性了。
相反,我们可以看看很多理工类的学科,比如计算机科学,比如理论物理,他们同样也大量倚靠数学,但是刨开数学,它们都有自己值得夸耀的“独立成分”。直白来说,一个在数学领域小有成就的研究者往往可以大言不惭地说自己做统计学家也可以一样优秀,但是在诸如计算机科学或者理论物理面前他就必须谨言慎行了。总结来说,纯统计学作为一个无法超越父辈的富二代,不管再牛逼,给人的印象永远只能是XX的儿子,而不是它自己。而诸如理论物理这样的学科,通过自己的不懈努力超越父辈,并且触及了父辈从未触及的领域,自然能够更加名正言顺地以独立形象示人了!
细心的读者可能会注意到,我刚刚用的词汇是“纯统计学”,我是有意这样表述的。实际上,大多数统计学家们并不会呆在所谓的“纯统计学”领域,他们大多最终会走向各个具体学科——因为统计学自身是没有研究实体的。这其实也是统计学让人觉得不是独立学科的一个重要原因,对学术研究熟悉的人会知道,很多社科在国际范围内的知识体系建立其实都是很水的,但是它们有自己特定的研究实体,所以它们就会有自己确凿的独立性。大多数统计学家们会从统计学跑到这些具体学科中,来帮助建设这些学科的科学规范与实践。比如我在的Methodology and Statistics Department就是致力于建设心理学以及其他社会科学的规范与实践,虽然大家做很多统计学的内容,但其实我们系的很多人不太会把自己称为Statistician。大家更倾向于混着叫,比如Statistician in Psychology,或者Methodologist and Statistician。所以,要是放在古时候,统计学就像一个老是生女儿的家庭,这个领域内培育出来的大多数统计学家最后都会“出嫁”,最后“随夫姓”,为“夫家”传宗接代,延续香火。自然而然地,统计学自身的独立地位,权威和知名度也就被不可避免地削弱了。
(三)
聊这么多,其中一方面有我个人的一些思考,同时也附带了比较多我入行以来涉猎的一些信息,也希望这些思考与信息能够对认真读到这里的读者有帮助。当然,我相信很多人更好奇的是,既然统计学的独立性如此孱弱,读统计学的出路到底如何呢?
我觉得这个问题可以分两方面来回答。首先,如果你是想通过统计学最终进公司工作,那么修读比较混合的课程(比如统计学+计算机科学)或许会更合适;比如现在国内很多互联网公司的高薪算法工程师,他们的工作内容其实和偏computational的统计学类博士与研究者的工作内容是很相似的,但是具体的应用情境有所不同。所以统计学的学习可以作为一个基础和前提,但是多元化的涉猎与了解是找到好工作的前提。
其次,就我个人更了解的学术领域而言,修读统计学其实是一个帮助你拓宽学术道路可能的万金油选项。在荷兰这边,几乎每所大学里面都有Methodology and Statistics Department,由此可见统计学与方法论在学术研究领域的需求程度,以及学者们对其的重视程度。统计学与方法论方面的学术基金也是相对比较好申的,因为大家可以想象,你开发一个方法,和你做一项具体的实证研究,哪个更容易在项目申请书上体现课题的重要性与贡献度,是一目了然的!中国学术圈目前虽然还没有如此成体系的对统计学与方法论的重视,但是根据我自己的经验,潜在的需求已经大量存在。这种潜在的需求可以从两方面来剖析,首先,近年来大量统计相关的微信公众号在兴起,各种统计方法工作坊也举办得很好;其次,我接触的大多数心理学的硕博项目中,最难翻越的大山就是统计学的学习,假如能够轻松翻越这座大山,那完成论文毕业对候选人来说完全是指日可待的事情!所以,如果你对中国学术未来发展的信心是8分,那么对统计学在学术领域发展的信息至少也得有10分!