高點研究所
首頁商研所許誠哲 因果推論(causality inference)
篇名
因果推論(causality inference)
作者
許誠哲
說明
發佈時間:20211101

2021年諾貝爾經濟學獎的其中一半,頒給了JoshuaD.Angrist與GuidoW.Imbens,以表彰他們對於因果推論分析的貢獻。在本次的專欄中,我將介紹因果推論分析的基本概念。

推論X變數對於Y變數是否有因果關係,稱作因果推論。在迴歸分析中,我們僅能看到變數之間是否存在著相關性,意即當我們觀測到變數X變動時,是否也可以同時觀測到Y也會相對應的變動。但這個結果無法作為因果關係的確認,因為無法確認Y的變動原因是來自於X的變動。舉例來說,令變數X為教育程度,Y為薪資所得。透過觀察實際的資料,我們可以發現108年大學學歷的薪資中位數為53.2萬元,研究所學歷的薪資中位數為95.9萬元。那麼是否可以推論學歷越高,則薪資所得會越高呢?答案是否定的,因為有可能存在某一遺漏變數,它是決定薪資的關鍵,只是恰好與學歷呈現相關,例如個人能力或者自我要求。故有可能其實是個人能力影響了薪資,而個人能力越強的人傾向追求較高的教育程度,而造成教育程度與薪資有著相關性。

那麼,我們要怎麼確認變數之間存在著因果關係呢?事實上,欲進行因果推論,應採取隨機對照試驗(randomizedcontrolledtrial,RCT),將受試對象(或標的)分成實驗組與對照組。實驗組與對照組除了X變數不同以外,其餘特性應有類似分佈。意即我們應該教全體的勞工隨機分成實驗組與對照組,其中兩組的勞工之性別、智商、英文與個人能力等的分佈都將類似。接著令實驗組的人員去念研究所,接著再比較他們的薪資,如果兩者之間有差距,才能推論此差距是來自於教育程度的影響。但我們實際觀察碩士學歷與大學學歷的勞工,可以發現兩個類別除了教育程度外,其他能力的分佈情況也都不太相同,因此可以推斷這個分組並不是隨機指派的。

在社會科學中,顯然地由研究者執行隨機對照實驗有困難,因此可找尋準實驗或自然實驗。準實驗或自然實驗係指對照組與實驗組的指定不是由研究者主觀認定,而是受試者無意識或者自然隨機決定。舉例來說,Angrist教授曾探討從軍對於薪資的影響。由於勞工是否選擇從軍的過程存在選擇偏誤,通常工作能力較高者不會選擇從軍,因此選擇從軍的人通常其他能力較弱。而Angrist教授利用越戰的國家隨機徵兵系統作為自然實驗,在越戰時,所有人都有相同的機率被抽到從軍,因此在這個狀況下,從軍與未從軍的組別其他能力分佈將相當類似。實證結果顯示從軍對於白人薪資有負面影響,但對於其他有色人種有正面影響。另一個可作為因果推論的研究方法為使用工具變數(instrumentalvariable,IV),我們將在下一次的專欄介紹工具變數與其有趣的應用。

關鍵詞
因果推論、隨機對照、因果關係、迴歸分析
刊名
商研所許誠哲