高點研究所
首頁商研所許誠哲 Chat GPT 可以應付研究所統計學入學考試嗎? II
篇名
Chat GPT 可以應付研究所統計學入學考試嗎? II
作者
許誠哲
說明
發佈時間:20250317

在本次的專欄中,我們將進入第二部份,教授自己出的多重選擇題,我們來看看 chatgpt 的表現吧!

(答案:d) 全部皆是。
以下逐點說明為何在(隨機分配)實驗中,仍然建議在迴歸分析中控制受試者的社經背景變數:

  1. 達成(或強化)條件獨立性假設
    理論上,若實驗中的「假新聞」處理是完全隨機分配,則處理組與控制組在各種未觀察或已觀察到的特徵上應該平均分配,因而自然而然能保證處理效果估計具有一致性。然而,真實研究中難免存在某些樣本不平衡、執行偏差或其他干擾因素;在模型中控制社經變數,可在更嚴謹的條件(條件式平均)下進行比較,進一步降低偏誤風險,強化「條件獨立性」假設成立的信心。
  2. 提高模型的解釋力(R-squared)
    當模型納入與因變數(例如:對某政黨的支持度)高度相關的社經特徵,如年齡、教育程度、政治立場傾向等,模型本身可解釋的變異自然會增高,因而提高 R-squared。雖然 R-squared 不是唯一指標,但常用來判斷模型對資料的配適度。
  3. 降低處理效果估計值的標準誤(Standard Error)
    控制額外的解釋變數(只要這些變數確實與因變數相關),可以「撇除」掉部分與處理效應無關的變異,使真正來自「假新聞處理」的影響更易於辨識,從而縮小估計量的標準誤,提高統計檢定的精確度及檢定力。

因此,控制實驗參與者的社會經濟特徵變數,同時能達成加強條件獨立性、提高模型的配適度、以及降低估計標準誤等多重目的;故正確答案為 (d) All of the above

短評: (A) 選項的分析有誤,增加解釋變數無法影響條件獨立的條件,此假設需利用隨機抽樣達到,因此此題是錯的。一個可能是翻譯所造成的影響,他將條件 conditional independence 誤以為是 conditional mean independence,一個表示誤差之間不相關,一個表示誤差項有外生性。

建議的答案:選 (c)。
教授所暗示的,往往是「有許多(重要但未能觀測到或未被納入的)因素都跑進了誤差項」,而這些因素很可能同時影響了工資(因變數)以及我們放進模型的自變數(個人特徵),亦即誤差項與解釋變數相關(endogeneity 問題)。以下逐一說明為什麼 (a) 與 (b) 不一定是教授要強調的重點,但 (c) 卻是最關鍵的推論:

  1. (a) R-squared
    雖然工資模型可能解釋度不高(R-squared 低),原因是工資易受許多難以觀測的特質或隨機因素影響;但「R-squared 低」並不是教授所說「生活就是誤差項」的唯一或必然涵義。它可能是事實,但不必然是教授真正想指的統計含意。
  2. (b) 誤差項具異質變異性(heteroskedasticity
    工資資料確實常出現異質變異(例如,高收入族群的工資變動幅度常較大),但教授的那句話不一定只是在點出「工資方程的誤差項違反等分散性」。異質變異性也許存在,但也不必然是其核心提醒。
  3. (c) 誤差項同時與因變數、解釋變數相關
    OLS 最怕的是誤差項與解釋變數相關(endogeneity),這會導致估計量產生偏誤與不一致。教授所謂「生活就是誤差項」,往往意味著有許多關鍵但無法觀測到的因素(如個人能力、家庭背景、社會關係網路等),既影響了工資(因變數),也往往與個體的受教育年數、工作經驗等解釋變數相關。這才是 OLS 無法輕易處理、又最易造成偏誤的問題。

綜合而言,如果教授只是「聳聳肩」並提到「生活就是誤差項」,多半是暗示 (c) 那種「誤差項同時與因變數和解釋變數相關」的內生性狀況才是最令人頭痛、也最需要進一步方法(如工具變數、固定效果模型等)去處理的部分,因此正確答案是 (c)

短評: 此題的對於選項的個別分析是正確的,但最後的答案應該是 (A),(B) 而不包含 (C)。(C) 選項雖然分析正確,但不符合題意。

答案:(d) 以上皆是。
原因解析

  1. 對數形式的係數解釋度高
    • 若模型是 ln(Y)=β0+β1X+ϵ\ln(Y) = \beta_0 + \beta_1 X + \epsilon,則 β1\beta_1 可近似解釋為:「XX 每增加 1 單位,YY 會有 β1×100%\beta_1 \times 100\% 的變動。」
    • 在經濟問題(例如薪資、價格)中,百分比變動較線性差異更直覺。
  2. 減緩異質變異性
    • 取對數能降低變數的尺度差異,常常能改善殘差分佈的同方差性。
    • 若原始資料在不同範圍出現劇烈波動,對數能壓縮高值,讓 OLS 更符合同方差假設。
  3. 可能提高R^2
    • 在許多實務上,Y 和 X 呈指數或冪次關係時,對數模型更能貼近資料行為,也就更容易提升決定係數(R^2)。

因此,以上三項原因都可能是取對數的主要考量,故答案為 (d) All of the above。

短評: (C) 選項不正確,將變數取對數的主要目的不是為了增加判定係數,而主要是解釋變數之間可能的非線性關係。

建議的答案:同時選 (b) 與 (c)
題目問的是:「在什麼情況下,將因變數取對數(log)來跑 OLS 可能會出現問題?」

  • 因變數有許多零值(b),則 ln(0)\ln(0)ln(0) 不存在;
  • 因變數有負值(c),則 ln(負數)\ln(\text{負數})ln(負數) 也不可能計算;

這兩種情況都會使對數轉換「直接無法執行」,或必須作特殊處理(例如加上一個常數後再取 log)。反之,(a)「因變數分配非常偏態(highly skewed)」通常正是經濟學家想要取 log 來改善資料分布、緩解異質變異或解釋方便的常見動機,本身並不構成「不宜取 log」的理由。
因此,真正會使對數轉換「麻煩」甚至「不可行」的條件,是 (b) 與 (c)。若選項必須擇一,則 (d)「All of the above」並不正確,因為 (a) 并不會使 log 轉換本身成為問題。

短評: 此題的分析與回答相當正確。

各選項評估:

  • (a) 「PM2.5 增加 1 μg/m3\mu g/m^3μg/m3,每英畝產量平均減少 100 公斤」
    只有在 TP=0TP = 0TP=0 時才能如此解讀;現實上溫度不等於 0°C,因此此說法不具普遍性。
  • (b) 「PM2.5 增加 1 μg/m3\mu g/m^3μg/m3,每英畝產量平均減少 101 公斤」
    只有在 TP=1TP = 1TP=1 時才是 -101;同理,若未指明溫度為 1°C,此說法也不普遍。
  • (c) 「若不知道平均溫度,就無法評估 PM2.5 對產量的平均影響」
    因為 ∂Y∂AQ=β+δ⋅TP\frac{\partial Y}{\partial AQ} = \beta + \delta \cdot TP∂AQ∂Y​=β+δ⋅TP,需要溫度資訊 才能判斷 PM2.5 的邊際影響,因此 (c) 是合理的敘述。
  • (d) 「以上皆荒謬」
    事實上 (c) 有其合理性,並非全部都錯。

短評: 此題的分析與回答相當正確。

答案是 (d) All of the above
原因:

  1. (a) 找到衡量科技進步的指標並將之納入模型
    • 若能取得反映科技進步的變數(如農業機械化比率、科研經費、專利數量等),就可以直接在迴歸中控制,避免漏列變數造成的偏誤。
  2. (b) 將年度固定效果 (year fixed effects) 納入
    • 若科技進步在各年度間整體提升,但在不同地區或縣市之間相對一致,那麼控制年度固定效果能捕捉「特定年份的共通影響」,包括整體科技水準的提升。
    • 這是處理整體趨勢(如整體技術進步)最常見且有效的方法之一。
  3. (c) 使用時間數列迴歸模型 (time-series regression)
    • 若資料有多年的縱向 (time-series) 特徵,使用時間數列方法(或追蹤資料模型)能更好地捕捉技術進步等隨時間變動的因素。
    • 特別在跨年度的大樣本下,可考量趨勢項、單根檢定等時間序列工具以應對技術在長期隨時間演進的影響。

短評: 此題的回答並不正確,使用時間序列分析並無法解決遺漏變數的問題。因此應選 (a),(b)。

我們可以發現 chat GPT 在複選題上的表現不如計算題來的好,一個可能原因是它容易受到選項 all of the above 的影響。因大部份的英文題目都是單一選擇題,它在訓練過程中所接受到的資料大多如此,因此容易為了將解答偏向以上皆是而想辦法合理化每一個選項。因此,雖然 chatgpt 可以針對大部份的題目給予可以參考的想法與方向,但也不是照本宣科的複製貼上,同學在應用時要將他當作是一個參考工具而不是一個全知全能的大神。

關鍵詞
ChatGPT、研究所統計學、入學考試
刊名
商研所許誠哲