选课的日子马上就要到了!
如果你对统计专业十分感兴趣!
想要成为Data Analyst/Statistician/Data Scientist
又或者想要对大数据行业有更多了解!
一定要提前清楚如何规划STAT的课程!
这篇文章来给你指路~
导师介绍
我们请来了资深STAT老师--球球为大家撰写STAT选课指南,里面包含了课程的大概内容,难易程度和部分推荐教授。
DSCI 100
Introduction to Data Science
大家不要被DSCI这个课号迷惑了。在课程网页上搜一下便可以发现DSCI除了100,剩下的就是两门300 Level和500 Level以上的研究生课。教你基本的用R写Code,本质上可以理解为给STAT同学准备的Coding入门课。内容虽然基础,但是牵扯的面很广,从最简单的求平均值到回归模型,分类模型等都有涉及,是重广度轻深度的课。因为是STAT专业的必修课,以及后续必修课的前导课,建议尽早上掉。老师没区别,统一课程内容和考试,大家按照自己的时间选取就可以。可以选择STAT 200以及DSCI 100一起拿,这样知识和软件应用可以一起结合。
STAT 200
Elementary Statistics for Applications
STAT 200基础课程包含统计基础概念和大部分的数据分析方法。很多专业都需要统计基础知识作为毕业论文的数据分析方法,学好200对任何专业的毕业论文或者研究生论文都有很大的帮助。在大数据时代下,很多工作和研究生项目都偏向于统计专业。STAT 200作为300 Level的统计课程的必修课程,建议Science的同学选择STAT 200,也是为了将来可以把300 Level统计课程作为一个选修的选择。
STAT 201
Statistical Inference for Data Science
作为统计专业必修课,STAT 201是数据科学的基础课程,对于之后想要了解Data Science同学是个不错的选择。课程会使用R,并且使用实际数据处理案例分析,进行数据模拟和Sampling/Resampling,可谓是一门非常实用的课程。尤其是Sampling/Resampling,如果吃透了这个概念对统计知识体系的建立大有裨益。考察方式包括作业,小组项目,Midterm和Final。这门课的前导课是DSCI 100。如果未来想要申请DS的研究生,非统计专业的同学可以选修201进行试水,自带的Group Project也是对实战和团队能力的提升。老师没区别,统一课程内容和考试,大家按照自己的时间选取就可以。
STAT 300
Intermediate Statistics for Applications
提升GPA的好课,建议所有人必修。这门课涵盖多种Non-parametric Hypothesis Tests, Regression Models和Time Series Analysis。课程内容丰富,但深度不大。所有的Test都是浅尝辄止,只需了解Test适用情况和简单计算就可以。考试可以带Cheating Sheet,是一门只需要理解就可以拿高分的课。统计课程,大都前后连贯性强,如果你的STAT 200学的很透彻,这个课可以说是很简单的。即使你的STAT 200基础不太牢,找L4的老师会帮你全方位归纳总结,快速高效的掌握课程内容。Fall Term老师一般是Marie,给分高,作业考试都很简单。只是教授的授课形式会有很多的小组讨论,而不是教授直接讲解。对于统计知识体系相对薄弱的同学而言,可能开始会有点吃力,但经过L4老师的归纳总结,应该很容易拿到高分。
STAT 301
Statistical Modelling for Data Science
STAT 301是一门基础知识结合实际应用的课程,这门课主要由每周的R作业,Exam以及Group Project组成。这门课是STAT毕业的必修课。如果刚学完STAT 201的同学,以及没有拿过其他300 Level的STAT课,那么可以根据我们L4老师的周课去学习基础知识,然后应用到作业R的Coding中。如果已经学习过了其他STAT课程,比如306,那么这门课的新知识点相对比较少,但R的应用性是非常高的。总而言之,这门课可以很好的帮助大家熟练R的应用以及Group project的协作性。
STAT 302
Introduction to Probability
STAT 302从之前的作业简单+考试偏难逐步演变成了作业与考试难度都较为适中的状态。Winter Term 1的教授为Jiahua Chen,这位中国教授讲课比较风趣,也比较照顾中国学生。Winter Term 2老师是Vivian Meng,是一位新老师,具体出题难易程度不清楚,但是应该会遵循以往的成绩分布。这门课一般均分都能很好得控制在70~75。
STAT 302一般由Written Assignment、Quiz、Webwork、Midterm和Final组成。Midterm相对比Written Assignment来说题目难度不大,题量难度都适中。Final题量相对较大,题目也不是很简单,考察的知识点非常的全面。题型在课堂和作业中都接触过,如果平时非常扎实地学习,Written Assignment都能够理解并熟练掌握,可以考一个好分数。
MATH 302和STAT 302的知识点是基本上相同的。MATH 302的侧重点在于计算能力,和对于知识点的理解。STAT 302的侧重点在于理解和分析一个问题,从实际问题中抽象出数学问题并求解。所以STAT 302较MATH 302考察知识点的方式更加灵活,但是对计算能力的要求更低一些。相比于MATH 302,更考察从实际问题中抽象出概率问题的能力。考察的知识点的方式较MATH 302来说,不是那么直接粗暴,需要认真读题分析题目。
STAT 305
Introduction to Statistical Inference
STAT 305典型的GPA Booster,统计最重要的必修课,建议其他专业的同学也必修。中阶统计,相较于STAT 300更强调理解,考察学生不同知识点之间的联系与区别,最后在理解的基础上考计算。计算的部分好说,毕竟知识点就那么几个,熟记计算过程大多数人都能自己搞定。但是理解的部分是拉开学生差距的地方。有些知识点你甚至不知道它的存在,因为老师上课会提到,但是笔记和书上不会给你明确的写出来。除非你上课100%集中精神无遗漏,否则就会麻烦。Term 1的Natalia之前一直教443,这是第二次见她教305。Term 2的Ben已经教授过好几个学期的305,我们L4的老师对这些老师也是很熟悉的,难度适中,推荐。
STAT 306
Finding Relationships in Data
是统计专业的必修课也是第一门Regression相关的课。所有的统计工作最需要的就是STAT 306!Regression作为统计学重要一部分,这门课的重要程度可想而知。这门课的主要内容是Linear Regression。课程从最简单的Simple Linear Regression开始,然后讲解了Multiple Linear regression,Generalized Linear Regression。除此之外还讲解了一些常用的Model selection techniques,比如Cross Validation。最后这个课还讲了Regression中可能会运用的其他知识,比如Explanatory Analysis中的PCA和Cluster Aanalysis。
课程难度根据不同的Prof会有不同,但是基本上公式运用和理解/证明的比例在6:4左右。同时,这门课需要学生有较好的Matrix的能力(MATH 221/307)如果这方面基础不好需要补补。总而言之,作为必修课难度不会特别小。
STAT 344
Sample Surveys
是300 Level为数不多的选修课,是一门以计算为主的简单统计课。主要讲解不同的Sampling Methods以及求每种Sampling Method所对应的Estimation和SE的方法。总的来说公式比较多,特别是期中考试的内容主要以运用公式为主。到后半段,有些知识点需要理解。
总体而言考试难度中等,学生只要多练习熟悉公式对不同Sampling Methods保持敏感度,再掌握一定的技巧,考试还是可以拿到高分的。Lang Wu作为344的Prof已经有6年的时间了,期末考试难度要远超于期中考试的难度,自从疫情后,他的考试不仅题量大而且难度也有所升级,L4的老师周课可以帮助学生更好的理解知识点,弄清各个公式的运用。如果要进加拿大统计局工作,必须学好这门课。
STAT 404
Design and Analysis of Experiments
主要讲解Experimental design的方法及分析模型。今年是由William Welch来教授,这也是他第一次教这门课,考试难度很难预测。相比300 Level的统计课,这门400 Level的必修课难度明显增加。学生需要有很好的STAT 306和MATH 307的基础,这门课考试题型比较灵活,作业一般都是由Jupyter来完成,知识结合R的应用。
总而言之STAT 404的学习方法需要有很大的改变,加上需要理解的东西比较多,考试题型灵活,学生往往需要花大力气才能取得比较好的成绩。但是这门课是作为申请统计研究生的重要考核标准!
STAT 406
Method for Statistical Learning
关于机器学习的,很热的Topic,难度较大,强调理解,基本无计算,统计系学生建议必修。为什么难却还建议必修呢?因为它确实有用,而且除了这个课也没有其他好的选择了,似乎是统计专业绕不开的一道坎。知识点纷繁杂乱,老师Daniel又是这个领域的青年翘楚,对你们这些他眼中的未来之星,继承其衣钵者充满了希望,要求较严格,有一个很独特的给分制度。Daniel强调平日Assignment,Lab,去年甚至取消了MT。如果你这些做的够好,就可以在Final之前拿到80分左右的成绩。Final会很难,强调理解,大部分同学会被压到30-50%。如果你想冲击90+,必须对知识点理解十分透彻。
建议一定找Tutor辅导,帮你捋顺知识点,也有历年真题帮你训练。如果你自己学,这是一个很有可能把你学哭的课。过去几年这个课一直在做改革,除了上面提到的给分制度,也加大了理解题的比例。这就要求大家要整个学期从头到尾不松懈,毕竟每个阶段都会Cover特定的知识点,都是强调理解的。以前很多同学Skip平日押宝Final的方法行不通了。
STAT 443
Time Series and Forecasting
存在感很低,但是几乎人人都选的课。说它存在感低是因为知识点跟其他统计课关系很少,非常独立的内容。但是这个课很多金融背景的学生也会去上。内容和金融相关。人人都选,一是它没有那么难(当然也不简单),二是高阶统计课选择确实少。难度先易后难,Midterm之前你可能没学明白就考试了,出了成绩一看哎哟还不错。如果你这时放松警惕那就GG了。Final覆盖几乎全部内容,Midterm之前的内容也会考,只不过考得更难更深。Midterm之后的内容量大不说,难度也上去了。要命的是这个课练习题少,除了课上的Activity几乎没有可以用来练习的题。
今年的老师是Natalia,是这门课最简单的一个老师。平日的作业和Webwork一年比一年难。她的Midterm会相对简单,但是不要被迷惑,因为Final难度不会低。如果没有学期班押题的话会非常难拿分。
DSCI 310
Reproducible and Trustworthy Workflows
for Data Science
这门课是Data Science Minor中高Level课里的五选三之一。建议想找DS工作/申请DS研究生的同学必学的课程。主要讲解如何自动化运行和测试代码和分析报告,管理数据分析软件的依赖性,打包和部署数据分析软件,并通过Version Control与他人合作。课程从熟练掌握GitHub,Dockerhub开始到建立并使用不同的Packages。这节课Midterm+Final只占到30%,其他的则是Project和作业。Midterm和Final类似于Project里的内容,只不过要求在很短的时间完成相对简易的版本。如果对整个流程或所相关的知识点不够熟悉,很容易造成在某一个环节卡住并运行不了。2022 Winter term 2的Midterm Median为87.75%,Final Median为57.5%。Final难度比Midterm高很多,因此熟练掌握所有知识点是很重要的,不然时间一定不够用。
关于就业方向
如果你喜欢统计,是统计专业,上过很多统计的课,希望今后找跟统计相关的工作,那么请务必仔细阅读下面的内容!
首先恭喜大家选择了一个就业相对容易,范围相对广泛,起点相对较高,发展前景极好的方向。
整体而言,北美对于统计专业毕业生的需求是很大的。这跟统计专业宽泛的就业选择分不开。不论是较为传统的生物统计、公共卫生、制药公司,还是时下最火的Data science,甚至华尔街投行的工作,统计方向的学生都是可以稍加准备就可以成为一名合格的申请者参与角逐的。
基础的统计工作,比如Statistical Data Analyst,本科文凭就可以。大家作为UBC的毕业生,因为有名校和本地毕业生光环加持,在温哥华地区找工作是有优势的。起薪在55k左右,本科里算相当不错了(咱们就不跟码农比了)。如果你不介意去东部发展,多伦多地区的机会更是多如牛毛,渥太华更是有养老圣地Statistics Canada。当然,如何进入Statistics Canada成为一名公务员也有很多门道,需要单独一篇文章来详述。如果你进科技公司,但是嫌码农太无聊,或者觉得自己Coding的能力不足,那么Data Analyst是你最好的选择。本科毕业就可以申请一些Data Analyst的职位,多是一些小公司或者初创,这种公司温哥华有很多。
导师建议
首先面临找工作,除了基本的能力以外你必须做到两点:
懂Data,会处理Data。
以及有一定的Coding能力。
对于Data的理解可以通过本科选修CS课来提升。处理Data的工具首选SQL,CS 304就是教这个的。而这里的Coding不是指码农Coding,更多的是做Statistical Analysis的Coding。最常用的Coding语言是R和Python,建议至少专精一个。
如果想起点更高一些,比如Public Health公司(类似于政府的公共卫生机构),Clinical Trial公司(制药厂或者制药厂的外包公司)的Statistician,或者大公司Data Scientist,读一个Statistics或者Data Science的Master Degree是很有必要的。加拿大这边统计的研究生很多学校是Research Base,一年给两万五左右的奖学金;加拿大的Business Analyst也是非常好的选择,就业率接近100%;Data Science项目的研究生是毕业之后年薪最高的Data职位;另外美国的Data相关的研究生项目选择更多,毕业之后留在美国工作的年薪也是加拿大这边的1.5倍左右,可谓进可攻退可守。(推荐OFFER101申研机构)
扫码添加LOOK4客服