高點研究所
首頁商研所許誠哲 異質變異數是什麼?會對於迴歸模型造成什麼影響?
篇名
異質變異數是什麼?會對於迴歸模型造成什麼影響?
作者
許誠哲
說明
發佈時間:20231023

再進行迴歸模型時,為了進行有效的統計推論,因此需要針對模型做若干假設。其中一個對於誤差項的重要假設是: 誤差項具有同質 (homoskedasticity) 變異數。同質變異數表示給定不同的解釋變數之值,此時誤差項或者是被解釋變數有相同的變異程度。舉例來說,若被解釋變數為薪資,解釋變數為不同的教育程度,則同質變異數表示在不同教育程度下,其薪資的變異程度是相同的,而這個假設很明顯地與實際的現象不符。實際的資料顯示,教育程度越高,其薪資的變異程度也越高。一個合理的解釋是,不同學歷下的薪資最低水準是相同的(即為最低薪資),但其天花板或者是獲得高薪的機會將隨著學歷越高而增加。因此在薪資—教育程度的模型中,異質變異數幾乎是必定存在且需要解決的問題。

在計量經濟學的課程中我們會學到,異質變異數對於迴歸模型的主要影響有 2 點:

1. OLS 估計式失去有效性
2. 迴歸係數的 t 檢定失效

對於第一個影響,由於我們對於係數的有效性不是很在意,只要具有不偏性與一致性即可,因此只要樣本數夠大通常不會考慮針對處理估計式的有效性問題。但迴歸係數的 t 檢定問題則需要積極解決,否則無法進行可靠的假設檢定。而之前的專題提到,這個問題可以使用 HC (heteroskedasticity) 標準誤解決。但只要誤差項的變異數隨著解釋變數之值增加而增加,則 HC 標準誤會比同質變異數下的標準誤還要大,因此使得 t 檢定之值較小,可能造成迴歸係數不顯著,這個是研究者最怕發生的事情。

在此提供 2 個可能解決顯著性的方案:

1. 使用較大的資料集合:由於顯著性會隨著樣本數增加,只要樣本數夠大,雖然 HC 標準誤會使得 t 檢定統計量變小,但檢定統計量通常還是可以大於檢定的臨界值。

2. 將被解釋變數取自然對數:迴歸係數的標準誤會與殘差 (residual) 平方和成正比,而殘差表示被解釋變數偏離迴歸線的程度。若被解釋變數為指數成長,則與迴歸線之間的距離可能會很大,因此若對於被解釋變數取自然對數,則指數成長的變數將為線性成長,偏離迴歸線的情況會改善許多,因此對於被解釋變數取自然對數通常有效的解決顯著性的問題。

關鍵詞
異質變異數、迴歸模型、heteroskedasticity、迴歸係數
刊名
商研所許誠哲