我从今年九月中旬开始了4年的PhD,这两天要放圣诞假了,我的PhD生涯也过去了3个月(6.25% pass)。在这三个月中我也学习了很多新东西,今天这篇文章就来总结我干了些什么,在介绍我的科研内容时,会不可避免地掺杂进各种专业术语。为了对大多数读者友好,我先对应标题,来轻松地介绍一些具体的科研日常。
由于我的博士研究是非实验类的课题,所以导师和学校都并不要求我天天,或高强度去办公室。我除了头两个礼拜还经常往学校跑,后面除了每周两次的组会与个人讨论,其他时候就很少去学校了。部门的其他同事也大都灵活办公,所以常常出现一整层算上我只有两三个人的情况。
【我们的公楼,独立于整个Faculty,是Departement自己壕气花钱租的……】
而由于居家办公是一种学校官方许可的方式,所以学校还有额外的政策来保证我的居家办公幸福度:每一个员工都有权利申请两台27‘显示器,大型拓展坞,电脑桌,电脑椅等等(电脑桌和电脑椅会直接配送到家)。这些福利之上,由于我们的项目经费十分充足(毕竟统计学的项目除了给博士博后发工资,没有啥必要的开销),导师还另外给我配了台顶配的macbook pro。所以在硬件方面,科研的幸福度可以说是很高了!
【当时从学校IT support提来电脑后拍的开箱图,当时的最大感受就是真沉啊!】
在这三个月里,我参加了两次学术会议。我们部门每个博士生每年都有2000欧的预算,可以用于参加学术会议,访学交换以及购买书籍等等事项。所以外出的这两次学术会议,从会议注册费,交通,住宿到吃饭(会议包饭),我都一分钱没花。注册与酒店这些大头的钱还可以通过学校系统或者秘书支付,自己不用通过自己的银行卡垫付,也算是实现了真正的公费零支出旅游!
【用来订酒店的学校系统,只需要选择自己心仪的酒店/行程,然后让学校付款即可】
虽然福利好,但是它并不能使具体的科研与学习变得很轻松,我会在后续对于我博士研究内容的具体介绍中阐释为什么它并不轻松。就日常而言,我每天基本需要学习和工作10小时以上,周末会选择性地整合出1天时间来休息(当然这种长时间的工作是出于我的个人兴趣和习惯,学校的明面要求是一周40h,而相应的管理则更加自由)。当然学习和工作时间长有一部分原因是我比较拖延,在没有早会的情况下,我每天会在9-10点之间起床,吃了早饭后视状态决定是否开始学习,以及是否从事需要大量脑力的学习与工作——大多数情况下是只想躺平。所以我就会看会儿游戏直播,学习一会儿,闲荡到中午吃过午饭后,再根据具体状态来决定是否要在家继续学习or去学校学习。下午一般学过2-3小时,放松会儿就做晚饭。吃完晚饭后会开几把游戏消化一下,等到晚上十点十一点的时候,我的夜来疯性格有时会发挥作用,帮助我专注地学习到凌晨一两点钟然后上床睡觉。
这三个月来大概有60%的日子都是这样度过的。一般来说,如果要学数学等较难的内容,我在家是很难进行下去的,所以会去学校,而如果是编程类的工作,我会在家完成,并且常常码到深夜。我现在要写的算法,无论在理论层面,还是代码层面,对我来说都是前所未有的复杂,所以算法不按预期工作的时候,我常常因为问题过于复杂而感到无从下手……简单来说,假如解决一个问题能给我带来10的成就感,那么它一定在之前给予了我5倍以上的焦虑与挫败感。而我未来的愿望就是,这个比例可以在未来缩小一些……
唠完了一些日常的内容,接下来介绍一下我的博士项目内容,我在标题中将自己称为心理统计学博士,主要是因为我们课题组要做一个叫作“结构方程模型2.0”的东西,而使用这个方法的学者大多为心理学或者其他社科学者,另外再加上我本科的心理学背景,似乎这个词比较妥当和谦逊(毕竟国内很多人目前对心理学的认知甚至是文科,之前还有极品后台私信骂我说文科生都出来教统计了……)。
而至于我研究的具体内容,实际上和心理学与主流的心理统计关系并不是很大。回想起来,我只在博士开始的一个月内读了大量的Factor Analysis与结构方程模型的书。当然,由于我自己的心理学背景,这一部分完成得很快,读的量也很多,我把读过的一些书籍整理在下面,有兴趣的朋友可以自行查找:
在读完这些书后,我后续的研究生活似乎就和心理统计关系不大了。我们做结构方程模型2.0,是为了将传统的结构方程模型框架应用于高维数据中,解决的研究问题和传统情境下的研究问题具有相似性,但是在技术端的解决办法,比如具体模型参数的估计,由于高维与数据量大的特点,则不能使用传统的方式去解决。
【在技术问题解决方面对我的研究项目具有重要意义的一篇survey】
因此,我主要需要从两个方向去学习知识与寻找解决办法,一方面是生物信息方向,高维统计是生信研究,尤其是基因类研究的一个重点,所以偏生信的方法类文献在这方面更加完善。当然由于我二硕项目所在的系本身就具有浓重的生物统计色彩,再加上我导师也是扎根生信多年的方法学者,所以这方面的学习并不是很难。
另一方面,由于复杂模型和大数据的情况下,参数估计需要用到一些高级的凸优化方法,所以我要学习凸优化课程,并且阅读一些来自工程领域的论文,比如IEEE和Signal Processing已经在这三个月在我的视野中出现过很多遍了……
这一部分的学习也是比较难的,因为相关的材料会涉及大量的数学证明,分析以及高级的线性代数运算。我可以很自信地说,我到目前都没有完整学完某个凸优化的相关课程,或者完整读完某一篇论文。更多的时候,我都是选择对我的问题解决有用的部分,或者抓住某篇论文的核心或主干去理解,要用多少,就学多少!
【一篇论文中会有大量的Theorems与数学推导,往往读完一两页就需要好几个小时时间】
这也是我觉得博士研究和本科硕士学习最不同的地方,在开始的这三个月里,我已经收藏了好多好多我认为还不错的课程与教材。比如,工程相关的线性代数应用课程,带各种完整证明的高维统计教材,十分综合的Numerical Methods相关的课程。再早两年,可能我花一个月时间就能搞定1-2个课程,但是博士期间却很难做到了——因为我有具体的问题需要去解决,不再有大把的时间做无目的的探索式学习了!
我的导师大概也是知道我是一个比较刨根问底的人,所以也经常提醒我:我们的重点是make it work,而不是方法背后的证明以及数学特性等等。后来我知道了,这可以被称为一种“工程思维”:作为一个工程师,你并不需要熟练地了解每一个工具的所有底层原理和工作方式,但是你必须知道如何使用这些工具,这些工具的用途等,并且能够将各种工具拼凑起来来完成一个大的,具体的工程。
这种思维的益处在我这三个月中的学习与研究中也不断得到印证,我目前的感觉是,大多数科研工作者所面临的问题,正如雷军说的那样,你能想到的问题,99%都已经有人给出解决方案了。你所需要做的是无非就是三步走:1. 明确自己所遇到的问题与表达形式(每个领域都会有不同的术语,问题也可以有不同的表达形式);2. 根据自己的问题查找有关文献(ChatGPT基本上可以帮助我们很好地完成这一步);3. 理解总结相关文献的内容,对相关内容进行适度的转化,使其能够应用于自己的问题。
我目前的感觉是,做好这三步,在大多数高校一路稳稳地做个正教授问题是不大的(只要你耐得住寂寞)。而如果你想要成为一个具有影响力的学者,那么你还需要一些对领域内研究问题的洞察力与嗅觉。当然,这三步说起来简单,但实际上我接触的大多数研究生可能在第一步就倒下了……同时,我自己在这三个月里虽然已经完成了差不多两套的“三步走”,但是这两套“三步走”的前两步都靠导师指了一个大方向,这种指引的作用也是很大的(至少在心理上)。如果让我自己完全独立地去走这三步,我依然拿不准我是否能够克服焦虑,并且很好地把问题解决。
“工程思维”和“三步走”的想法是我这三个月来最大的感悟了!最近NeurlPS2024结束,今天还看到了AI领域博士红利渐渐消失的新闻:
虽然客观来讲我觉得自己并不是一个需要去担心就业的人(因为要求不高,技能也比较多),但是AI的业界从对researchers的需求慢慢转向本硕学生也可以胜任的AI engineers,是值得我去思考和注意的。同理,目前业界也大量需求程序员,而非计算机科学家。所以,对于任何一个初入学术界的萌新来说,尤其是和我类似领域的,千万不要因为自己解决了什么理论性的科研问题而沾沾自喜(因为领域限制,你以为的理论问题理论价值大概都不会很大),争取多看到自己所做领域的工程特性与价值,并在日常的科研生活中花时间去了解和强化它,或许会是一个比较明智的选择!