皮爾森卡方檢驗
此條目可參照英語維基百科相應條目來擴充。 |
皮爾森卡方檢定(英語:Pearson's chi-squared test)是最有名卡方檢定之一(其他常用的卡方檢定還有葉氏連續校正、似然比檢定、一元混成檢定等等--它們的統計值之概率分配都近似於卡方分配,故稱卡方檢定)。「皮爾森卡方檢定」最早由卡爾·皮爾森在1900年發表,[1] 用於類別變數的檢定。科學文獻中,當提及卡方檢定而沒有特別指明類型時,通常即指皮爾森卡方檢定。
原假設
[編輯]「皮爾森卡方檢定」的虛無假設(H0)是:一個樣本中已發生事件的次數分配會遵守某個特定的理論分配。
在虛無假設的句子中,「事件」必須互斥,並且所有事件總概率等於1。或者說,每個事件是類別變數(英語:categorical variable)的一種類別或級別(英語:level)。
簡單的例子:常見的六面骰子,事件=丟骰子的結果(可能是1~6任一個)屬於類別變數,每一面都是此變數的一種(一個級別)結果,每種結果互斥(1不是2, 3, 4, 5, 6; 2不是1, 3, 4 ...),六面的概率總和等於1。
用途和步驟
[編輯]「皮爾森卡方檢定」可用於三種情境的變項比較:擬合度檢定、同質性檢定和獨立性檢定。
- 「適配度檢定」驗證一組觀察值的次數分配是否異於理論上的分配。
- 「同質性檢定」可以比較在使用相同的分類變數時,兩組或兩組以上群體的計數分佈。
- 「獨立性檢定」驗證從兩個變數抽出的配對觀察值組是否互相獨立(例如:每次都從A國和B國各抽一個人,看他們的反應是否與國籍無關)。
不管哪個檢定都包含三個步驟:
- 計算卡方檢定的統計值「 」:把每一個觀察值和理論值的差做平方後、除以理論值、再加總。
- 計算 統計值的自由度「」。
- 依據研究者設定的置信水平(顯著性水平、P值或對應Alpha值),查出自由度為 的卡方分配臨界值,比較它與第1步驟得出的 統計值,推論能否拒絕虛無假設。
適配度檢定
[編輯]適配度檢定(英語:Goodness of Fit test):測試樣本的概率分配與總體有多相似。
總體假設為離散型均勻分配
[編輯]當理論上的總體分配為每個類別概率一致時,即應適用離散型均勻分配的計算方法。 個觀察值於理論上應均勻分配在所有的 個欄位(類別)中,因此每個欄位(類別)的「理論次數」(或期望值次數)為:
- ,其中
自由度 。「」是總共要計算離差平方的個數(每個類別計算一次觀察值與理論值的差,再平方)。「」是因為對於計算而言只有一個限制條件:觀察值的個數總和為 。
總體假設為其他種分配
[編輯]貝氏算法
[編輯]例子
[編輯]獨立性檢定
[編輯]在同一個個體(例如:同一個人)身上有兩個二元變數(X, Y),例如 X(男/女)和 Y(右撇子/左撇子),觀察兩個變數的相關性。虛無假設是:兩個變數呈統計獨立性。在本例中:性別與慣用手是獨立事件。
- 首先,每個觀察值(每個抽出的人)會被重新編排到一個叫做「列聯表」(英語:contingency table,又稱:條件次數表)的二維表格裏。本例的列聯表是2×2的構造(不算入Total欄位):
男 | 女 | 總計 | |
---|---|---|---|
右 | 43 | 44 | 87 |
左 | 9 | 4 | 13 |
總計 | 52 | 48 | 100 |
- 如果列聯表共有 r 行 c 列,那麽在獨立事件的假設下,每個欄位的「理論次數」(或期望值次數)為:
- ,
- 其中 N 是樣本大小(觀察值的個數,亦即2×2列聯表所有欄位的總和,本例:N = 100)。本例的各欄位期望值如下(括號裏的數字):
男 | 女 | 總計 | |
---|---|---|---|
右 | 43 (45.24) | 44 (41.76) | 87 |
左 | 9 (6.76) | 4 (6.24) | 13 |
總計 | 52 | 48 | 100 |
- 統計值的公式是:
- 本例的統計值是:
- 自由度 是這樣得出:雖然總共要計算 個離差平方(每個欄位計算一次觀察值與理論值的差,再平方),但 X 變數有1個限制條件(樣本抽出後,男性的人數即固定),Y 變數也有1個限制條件(樣本抽出後,右撇子的人數即固定),所以可自由變動的欄位數只有 。
- 在本例中。
- 在 的條件下,得出卡方分配右尾概率 ,無法拒絕虛無假設,亦即:無法拒絕性別變數與慣用手變數互相獨立的假設。
限制
[編輯]- 如果個別欄位的期望值次數太低,會使概率分配無法近似於卡方分配。一般要求:自由度 時,期望值次數小於5的欄位不多於總欄位的20%。
- 若自由度 ,且若期望值次數 ,則近似於卡方分配的假設不可信。此時可以將每個觀察值的離差減去 之後再做平方,這便是葉氏連續校正。
參考文獻
[編輯]引用
[編輯]- ^ Karl Pearson. X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science: 157–175. doi:10.1080/14786440009463897.
期刊文章
[編輯]- Herman Chernoff, E. L. Lehmann. The Use of Maximum Likelihood Estimates in $\chi^2$ Tests for Goodness of Fit. The Annals of Mathematical Statistics. 1954-09, 25 (3): 579–586 [2018-04-02]. ISSN 0003-4851. doi:10.1214/aoms/1177728726. (原始內容存檔於2021-02-26) (英語).
- R. L. Plackett. Karl Pearson and the Chi-Squared Test. International Statistical Review / Revue Internationale de Statistique. 1983, 51 (1): 59–72 [2018-04-02]. doi:10.2307/1402731. (原始內容存檔於2021-04-16).
書籍
[編輯]- Nikulin, Priscilla E. Greenwood ; Mikhail S. A guide to chi-squared testing. New York, NY [u.a.]: Wiley. 1996. ISBN 047155779X.