格魯布斯檢驗法

格拉布斯檢驗法（Grubbs's test），有時也被稱為最大歸一化殘差檢驗，是一種在統計學中用於分析異常值的方法，因發明者弗蘭克·E·格拉布斯（英語：Frank E. Grubbs）而得名^[1]。

定義

格拉布斯檢驗法基於數據服從常態分布的假設，用於檢驗單變量（英語：Univariate）數據集內的離群值。因此，在使用格拉布斯檢驗法時，必須先檢驗數據的分布是否可以用常態分布進行近似^[2]。

格拉布斯檢驗法定義於如下假設之上：

H₀：數據集中沒有異常值；

H_a：數據集中只有一個異常值。

定義格拉布斯檢驗統計量為：

G={\frac {\displaystyle \max _{i=1,\ldots ,N}\left\vert X_{i}-{\bar {X}}\right\vert }{s}}

其中， ${\overline {X}}$ 和 $s$ 分別指代的是樣本的均值和標準偏差。

如果採用雙邊檢驗（英語：two-sided test）的方法，則格拉布斯檢驗可按照以下步驟進行：

將數據集中的 $n$ 個數值由最小排列到最大，則最小值 $X_{1}$ 或最大值 $X_{n}$ 為可能的可疑數值。若要檢驗最小值是否為離群值，則可以按如下公式計算：

G={\frac {{\bar {X}}-X_{1}}{s}}

檢驗最大值時，則為：

G={\frac {X_{n}-{\bar {X}}}{s}}

對該雙邊檢驗，若下式成立，則在置信度為 $\alpha$ 處，無偏差值的假設不成立：

G>{\frac {N-1}{\sqrt {N}}}{\sqrt {\frac {t_{\alpha /(2N),N-2}^{2}}{N-2+t_{\alpha /(2N),N-2}^{2}}}}

其中， ${t_{\alpha /(2N),N-2}^{2}}$ 表示t-分布中當自由度為 $N-2$ 、顯著性水平為 ${\frac {\alpha }{2N}}$ 時的上臨界值。如果採用單邊檢驗方式，則應該將顯著性水平改為 ${\frac {\alpha }{N}}$ 。

^ Grubbs, Frank E. Sample criteria for testing outlying observations. Annals of Mathematical Statistics（英語：Annals of Mathematical Statistics）. 1950, 21 (1): 27–58. doi:10.1214/aoms/1177729885.
^ 1.3.5.17 Detection of Outliers. NIST/SEMATECH e-Handbook of Statistical Methods. NIST. 2012 [2019-03-09]. （原始內容存檔於2019-06-19）.

Grubbs, Frank. Procedures for Detecting Outlying Observations in Samples. Technometrics (Technometrics, Vol. 11, No. 1). February 1969, 11 (1): 1–21. JSTOR 1266761. doi:10.2307/1266761.
Stefansky, W. Rejecting Outliers in Factorial Designs. Technometrics (Technometrics, Vol. 14, No. 2). 1972, 14 (2): 469–479. JSTOR 1267436. doi:10.2307/1267436.