高點研究所
首頁商研所許誠哲 以 Monte Carlo 模擬驗證中央極限定理 (Central Limit Theorem)
篇名
以 Monte Carlo 模擬驗證中央極限定理 (Central Limit Theorem)
作者
許誠哲
說明
發佈時間:20230116

學習統計學的同學,一定會聽過中央極限定理,這是近代統計學最重要的定理之一 (另一個是貝氏定理,我將在下一次的專欄中介紹)。中央極限定理的版本很多,其中較為簡單易懂的數學表示方式如下:

給定

以白話文來說,無論母體分配為何,只要給定的期望值與變異數存在下,其隨機樣本的樣本平均,只要樣本數足夠大,則其樣本平均的抽樣分配將近似於常態分配。中央極限定理之所以重要而且應用廣泛,主要來自於對於資料母體來源假設的放寬。事實上, 使得樣本平均”看起來”像常態分配的確切樣本數並沒有一定標準,視樣本的母體分配的偏態係數與峰態係數而定。若分配越不對稱或者越厚尾, 則需要較大的樣本數, 才會比較接近常態分配。因此使得中央極限定理成立的樣本數視原始分配與常態分配的差距而定, 並沒有一致的標準, 但一般教科書認為樣本數至少為 30 下可視作足夠大。中央極限定理亦可以較數理統計的表示方式為

其中表示為分配收斂,即為在樣本數無限大下,兩者有相同的分配。其中若隨機變數的變異數存在,亦可將母體標準差σ以樣本標準差S取代,其分配亦為常態分配。這種表示方式也是一般在模擬時所使用的版本。

110 年交大管科曾考過如何以 Monte Carlo 模擬驗證中央極限定理,以下簡單敘述如何使用統計軟體進行模擬的過程:

  1. 在母體中抽取足夠大的樣本數 n 的資料, 其中 n 即為使得中央極限定理成立的樣本數。
  2. 對於抽取出的樣本計算其樣本平均並作標準化:

將上述步驟重覆施行 500 或 1000 次, 將的相對次數直方圖繪出, 並與標準常態分配的理論密度比較。若與標準常態分配相似, 可視作中央極限定理成立; 若不成立, 可視作中央極限定理不成立。以下繪出兩種不同的分配,分別為符合假設的指數分配(平均為 1, 圖左)與不符合假設的 t 分配(自由度為 1, 其期望值與變異數都不存在, 圖右),並將其標準化的樣本平均之相對次數直方圖繪出並與標準常態分配的理論密度比較, 此例中 。可以發現, 指數分配繪出的結果與標準常態相當類似,但 t 分配的相對頻率與常態分配相去甚遠。

關鍵詞
中央極限定理、Central Limit Theorem、統計學
刊名
商研所許誠哲
該期刊-上一篇