【推薦書籍】
統計學(含概要)歷屆試題詳解、
統計學:重點觀念與題解(上) 、統計學:重點觀念與題解(下) 、計量經濟學與財務工程、
統計學精選666題
【推薦課程】
行動版、數位課程
本次專欄,我將介紹蒐集統計資料的常見方式。統計學是蒐集資料並處理的科學,而常見的蒐集資料方式有以下三種:
- 調查 (survey): 不控制母體特性下, 直接蒐集資料
- 實驗 (experiment): 控制母體特性下, 探討單一變數的影響
- 觀察 (observation): 不與研究對象有直接接觸, 透過觀察其活動紀錄獲得資料的方式
調查的方法可分為普查 (census) 與抽樣 (sampling)。普查為蒐集母體裡的所有樣本, 優點為具有普遍性與全面性,缺點為所需要耗費的成本(包含人力與時間等)較多,故通常由政府施行, 且施行的頻率也不會太高。例如臺灣人口普查每十年調查一次,最近一次的全面普查是 2000 年。近兩次的人口普查為了降低成本,因此以普查輔以部分抽樣的方式進行。抽樣為抽取母體裡的一小部分樣本,優點是所需的成本較低,而其缺點是如果抽樣的過程不恰當,其樣本可能不具代表性。例如想要知道台大學生的平均智商,若去醫學院校區的圖書館抽樣可能得到一組平均智商較高的資料,可能會高估其結果。
若採用實驗方法蒐集資料,其主要目的是為了控制其他變數不變下 (other things being equal, 或以拉丁文 ceteris paribus 表示),確認變數之間的因果關係 (causality)。即若接受了特定的處理 (treatment), 是否會影響特定的依變數 (dependent variable)。例如若想知道新的藥物是否有效的降低血壓,則特定處理即為服用降血壓藥物, 依變數為血壓, 其他變數為性別、年齡、體重與是否有慢性病史等。進行此新藥實驗蒐集資料時,需先將受試者隨機分成實驗組 (treatment group) 與對照組 (control group)。而分組時,需確保實驗組與對照組的組成其性別、年齡或其他身體狀況需有類似的分配。接著實驗組投以降血壓藥物,對照組則施以安慰劑 (通常是維他命 C),接著再比較兩組的實驗前後的血壓差距,如果實驗組的血壓有明顯的下降而對照組沒有,因為兩組當初在分組時其組成的分配類似,唯一的差別就是實驗組的群體有服用降血壓藥物,
因此可以證明造成血壓降低的原因是來自於服用該藥物。
但值得一提,實驗組與對照組的分群需要由研究者主動分群以保證兩群體所有特性相同,若是觀察到兩個不同類型的群體,不可視為隨機分組後的結果。
例如欲探討高中的生師比高低對於成績的影響,生師比為一個學校中,學生人數除上老師人數,是以生師比低表示一個老師要負擔的學生人數較低。通常私立學校的生師比較低,且其家庭所得或者家長的智商相較於公立學校高。故若如果直接比較生師比低與高的學校之平均成績 (可利用大學學科能力測驗的分數衡量),將無法確認使得成績高低的影響是來自於生師比還是所得或者智商。
欲進行真正的實驗,應將所有高中生打散隨機分成實驗組 (低生師比) 與對照組 (高生師比) 的兩個群體。如此一來,實驗組與對照組除了生師比外,其他變數都有相同分配。若兩組的成績有差異,才可判斷差異是來自不同的生師比而不是其他變數。但顯而易見的,在臺灣是不太可能施行這樣的實驗。因為即使分到高生師比的高中可以獲得補償,家長也不會願意參加這種實驗。
例如股票價格與匯率等總體資料,都是實際的經濟活動所留下的記錄,不需要特別抽樣或訪問即可獲得,與成績與所得等個體資料蒐集的過程不太相同。