【推薦書籍】
統計學(含概要)歷屆試題詳解、
統計學:重點觀念與題解(上) 、統計學:重點觀念與題解(下) 、計量經濟學與財務工程、
統計學精選666題
【推薦課程】
行動版、數位課程
配對問題 (matching problem) 是機率論中的經典例題。想像一個情境: 有 n 個人相約進行交換禮物的活動,但由於報到的時候沒有標記這個禮物來自於哪一個人,因此只能直接進行交換禮物。然而,每個人都有可能會拿到自己的禮物。若令 X 表示拿到自己的禮物的人數,則探討 X 的統計性質即為配對問題。
這樣的題目也有可能出現在研究所考題中。舉例來說,以下是 111 年政大國貿的考題:
"30 people took a COVID-19 PCR test. However, the doctor was so careless that she/he forgot to label the test. She/he had to give back all the test results randomly, with one unique sample to each person. In particular, each person gets her/his own test result with probability 1/30. Let X be the number of people who get their own test results.
(a) (10%) What is the expected value of X?
(b) (10%) What is the variance of X?"
題目的大意是有 30 個人做了 PCR 檢測後,但因故忘了標記,因此將這 30 個結果隨機退回這 30 個人。令 X 表示這 30 個人中拿到自己 PCR 檢測的人數,欲計算其期望值與變異數。
在此介紹解題的方法。為使此結果更具一般性,假設共有 n 個人參與此配對情境。由於每個人都有 1/n 的機率抽到自己的禮物,定義指標函數如下
可看出 E(X) 與 n 無關, 皆為 1, 此例中 n=30, 故 E(X) = 1。
接著計算變異數,由於 與 並不獨立 , 因此需考慮其共變異數。
其中只有==1時,才不為 0。此事件發生的機率即為兩人皆選到自己的檢體之機率。因此
此例中 n=30, 而 Var(X) 與 n 無關, 因此 Var(X) = 1。最後,利用 R 語言進行模擬配對問題。在進行 100 萬次模擬後,計算其平均與變異數,可以發現其結果與理論結果相當接近。
> num_sim <- 10e5
> sim_result <- array(0,num_sim)
> set.seed(123)
> for(i in 1:num_sim)
+ {
+ sim_result[i] <- sum(sample(seq(1,30),30)==seq(1,30))
+ }
> mean(sim_result)
[1] 0.999969
> var(sim_result)
[1] 0.999936