美國統計碩士第三學期 23 Spring 就讀心得

一年回顧

Posted by Howard Peng on July 11, 2023

前言

回來台灣已經快一個月,休息了一陣子,來回顧一下上個學年度最後一個學期上了什麼課,也給有興趣的人一個參考。我所有的感想都是個人心得,不代表所有人的感覺,每年教授安排也都不一定一樣,所以參考就好。

修課心得

我 23 Spring 選了下面三門課:
STAT 32950 — Multivariate Statistical Analysis: Applications and Techniques
STAT 35920 — Applied Bayesian Modeling and Inference
BUSN 41201—Big Data
這學期只有第一門課是 Program requirement,後面兩個都是我自己選的選修,其中Big Data 是Booth 底下開的課,以下就稍微分享一下上完下面三門課的心得。

STAT 32950 — Multivariate Statistical Analysis: Applications and Techniques

Instructor: Mei Wang

當初有兩個必選課在這個學期可以讓我們選,另外一門是 STAT 348-Modern Methods in Applied Statistics,我看了課程大綱我更喜歡 32950 這門課,雖然說這門課是屬於 Theoretical sequence,但是課程內容很多東西我都很想學,大部分是多變數統計的分析和方法,課程後半教了Machine Learning的演算法,主要都是演算法背後的數學理論,而應用部分是使用 R,沒有使用Python 有點可惜,不過多打一些ML的地基,對自己也是有幫助的。

在選之前就有聽說作業量很大,而確實是如此,每周一份作業,大約6-7大題,每題的內容都是上課教的內容,不會有超剛的情況,但是最後寫完都是寫到十幾頁。另外老師還有要求作業格式希望用LaTex 完成,所以我都是用Rmarkdown,融合我的程式碼,因此花的時間又比直接寫多了不少。考試的部分是一次期中一次期末,考試格式和作業類似,準備起來不會有力不從心的感覺,是很有方向的準備,除此之外也可以帶一張Cheat sheet,讓大家不用把上課教的公式全部背下來,不然太多了。

總體而言,我在這門課學到了不少,教授上課時也給我們很多幫助,課後和考試後都很願意瞭解大家的問題,也有很多office hour。這門課有兩個時段,我選擇的是比較早的,所以上課的人比較少,也因此老師可以比較照顧到大家的問題,大家上課的風氣也很不錯,都很踴躍問問題,上課的時候有很多討論,雖然有時候大家感覺蠻累的,畢竟時間有點早。蠻推薦這們課的。

STAT 35920 — Applied Bayesian Modeling and Inference

Instructor: Yuan Ji

這門課就是我選的選修了,隸屬於 Public Health Sciences,主要的上課內容是貝氏統計,教了很多方法和理論,前半段是理論的部分,包含 Bayesian Theory 和 modeling,後半則是教一些Sample常用的演算法,包含Markov chain Monte Carlo methods 和Gibb Sampling 等等,主要是如何計算。

班級人數很少,老師上課也很鼓勵大家討論,因此除了課程內容之外,也練習了蠻多英文口說,上課風格不像平常純輸入,很多時候會希望我們多多給意見,我蠻喜歡這種上課模式。

作業大約是兩週一次,有手算的,也有Computation,主要也是使用R語言,學期中有兩次考試,題型和作業相似,期末則有老師指定主題的 Project,期末最後一堂課讓大家 Present,老師把大家分成兩組,其中我在的組都是Stat major 的同學,所以老師分配一個比較需要讀數學理論能力的題目,然後模擬出老師想要看到的結果。我個人覺得蠻有趣的,可以和同學合作讀paper ,然後試著implement,雖然可能結果沒有完全完成,但是確實學到很多。

BUSN 41201 — Big Data

Instructor: Veronika Rockova

最後一門課是 Big Data,從課程安排來看,內容其實有六成都已經學過,從 Regression, Classification,到 Clustering, Machine Learning,也是上課的時候老師講理論,搭配實際的data 例子,每星期一份slide,一個主題。雖說有部分內容聽過,但是老師講的挺仔細的,有些細節老師補充很多,原本我沒搞清楚的地方,老師講完腦裡架構清楚很多。

總共只有一次 take home 期中考,作業則是每周一次,期末有 final project,題目可以自己找dataset,內容則是包含上課講過的東西就可以,作業和project 都是分組完成,所以有很多需要討論的地方,和需要討論的時間,雖然有時候覺得分組的效率不高,但是這也是一種訓練,訓練和人溝通的能力,和分配工作和整合的能力。整體而言,課程loading 不會太重,但是認真學還是能學到東西。一樣可惜的是上課用的程式語言還是R,所以我上學期三門課都是使用R,說實話我Python 的熟練度有一點下滑,希望下個學期能多用 Python。

後記

上學期三門課都是選不同學院的課,上課風格也都很不一樣,在必修都上完後,可以自由選擇想上甚麼,感覺很不錯,體驗到了各種老師的風格。雖然不知道離我想到的目標還有點遠,但我認為應該有愈來愈靠近。

Medium Version