学生t检验

维基百科,自由的百科全书
跳转至: 导航搜索

學生t檢驗英语Student's t-test)是指零假设成立時的任一檢定統計有學生t-分佈統計假說檢定,屬於母數統計。學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本期望值的是否為某一實數,或是二群來自常態分配母體的獨立樣本期望值的差是否為某一實數。

由來[编辑]

學生t檢驗是威廉·戈塞為了觀測釀酒品質於1908年所提出的,「學生」則是他的筆名[1][2][3][4] 基於克勞德·健力士(Claude Guinness)聘用從牛津大學劍橋大學出來的最好的畢業生,[2]以將生物化學及統計學應用到健力士工業流程的創新政策,戈斯特受雇於都柏林的健力士釀酒廠擔任統計學家。戈斯特提出了t检验以降低啤酒质量监控的成本。戈斯特於1908年在《Biometrika》期刊上公布t檢驗,但因其老闆認為其為商業機密而被迫使用筆名。實際上,其他统计学家是知道戈斯特真實身份的。

今日,它更常被應用于小樣本判斷的置信度。[來源請求]

應用[编辑]

最常用t检验的情况有:

  • 单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如檢驗一群人的身高的平均是否符合170公分。
  • 双样本检验:其零假设为两个正态分布的总体的均值之差為某實數,例如檢驗二群人的身高之平均是否相等。这一检验通常被称为学生t检验。但更为严格地说,只有两个总体的方差是相等的情况下,才称为学生t检验;否则,有时被称为Welch检验。以上谈到的检验一般被称作“未配对”或“独立样本”t检验,我们特别是在两个被检验的样本没有重叠部分时用到这种检验方式。
  • 检验同一统计量的两次测量值之间的差异是否为零。举例来说,我们测量一位病人接受治疗前和治疗后的肿瘤尺寸大小。如果治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸变小了。这种检验一般被称作“配对”或者“重复测量”t检验。
  • 检验一条回归线的斜率是否显著不为零。

前題假設[编辑]

大多數的t檢定之統計量具有t = Z/k的形式,其中Zk是已知資料的函數。Z通常被設計成對於對立假說有關的形式,而k是一個尺度參數使t服從於t分佈。以單樣本t檢驗為例,Z = \bar{X}/(\sigma/\sqrt{n}),其中\bar{X}為樣本平均數,n為樣本數,\sigma為資料母體之標準偏差。至於k在單樣本t檢驗中為\hat{\sigma}/\sigma,其中\hat{\sigma}為樣本的標準偏差。在符合零假說的條件下,t檢定有以下前題:

  • Z 服從標準常態分佈
  • (n - 1)k2 服從自由度(n - 1)的卡方分佈
  • Zk互相獨立

計算[编辑]

單樣本t檢驗[编辑]

檢驗零假說為一群來自常態分配獨立樣本xi之母體期望值μμ0可利用以下統計量

 t = \frac{\overline{x} - \mu_0}{s/\sqrt{n}}

其中i = 1 \ldots n\overline{x} = \frac{\sum_{i=1}^{n} x_i}{n}為樣本平均數,s = \sqrt{\frac{\sum_{i=1}^{n}(x_i-\overline{x})^2}{n-1}} 為樣本標準偏差n樣本數。該統計量t在零假說:μ = μ0為真的條件下服從自由度為n − 1的t分佈

配對樣本t檢驗[编辑]

配對樣本t檢驗可視為單樣本t檢驗的擴展,不過檢驗的對象由一群來自常態分配獨立樣本更改為二群配對樣本之觀測值之差。

若二群配對樣本x1ix2i之差為di = x1ix2i獨立且來自常態分配,則di之母體期望值μ是否為μ0可利用以下統計量

 t = \frac{\overline{d} - \mu_0}{s_d/\sqrt{n}}

其中i = 1 \ldots n\overline{d} = \frac{\sum_{i=1}^{n} d_i}{n}為配對樣本差值之平均數,s_d = \sqrt{\frac{\sum_{i=1}^{n}(d_i-\overline{d})^2}{n-1}} 為配對樣本差值之標準偏差n為配對樣本數。該統計量t在零假說:μ = μ0為真的條件下服從自由度為n − 1的t分佈

獨立雙樣本t檢驗[编辑]

樣本數及變異數相等[编辑]

若二群獨立樣本x1ix2i具有相同之樣本數n,並且彼此獨立及來自二個變異數相等的常態分配,則二群母體之期望值差μ1 - μ2是否為μ0可利用以下統計量

 t = \frac{\overline{x}_1 - \overline{x}_2 - \mu_0}{\sqrt{ 2s_p^2 / n}}

其中i = 1 \ldots n\overline{x}_1 = (\sum_{i=1}^n x_{1i}) / n\overline{x}_2 = (\sum_{i=1}^n x_{2i}) / n為二群樣本各自的平均數,s^2_p = ( \sum_{i=1}^n (x_{1i}-\overline{x}_1)^2  + \sum_{i=1}^n (x_{2i}-\overline{x}_2)^2 ) / (2n-2) 為樣本之共同變異數。該統計量t在零假說:μ1 - μ2 = μ0為真的條件下服從自由度為2n − 2的t分佈

樣本數不相等但變異數相等[编辑]

若二群獨立樣本x1ix2j具有不相同之樣本數n1n2,並且彼此獨立及來自二個變異數相等的常態分配,則二群母體之期望值之差μ1 - μ2是否為μ0可利用以下統計量

 t = \frac{\overline{x}_1 - \overline{x}_2 - \mu_0}{\sqrt{ s_p^2 / n_1 + s_p^2 / n_2}}

其中i = 1 \ldots n_1,其中j = 1 \ldots n_2\overline{x}_1 = (\sum_{i=1}^n x_{1i}) / n\overline{x}_2 = (\sum_{i=1}^n x_{2i}) / n為二群樣本各自的平均數,s^2_p = ( \sum_{i=1}^n (x_{1i}-\overline{x}_1)^2  + \sum_{j=1}^n (x_{1j}-\overline{x}_1)^2 ) / (n_1 + n_2 - 2) 為二群樣本共同之變異數。該統計量t在零假說:μ1 - μ2 = μ0為真的條件下服從自由度為n1 + n2 − 2的t分佈

變異數皆不相等[编辑]

若二群獨立樣本x1ix2j具有相等或不相同之樣本數n1n2,並且彼此獨立及來自二個變異數不相等的常態分配,則二群母體之期望值之差μ1 - μ2是否為μ0可利用以下統計量

 t = \frac{\overline{x}_1 - \overline{x}_2 - \mu_0}{\sqrt{ s_1^2 / n_1 + s_2^2 / n_2}}

其中i = 1 \ldots n_1,其中j = 1 \ldots n_2\overline{x}_1 = (\sum_{i=1}^{n_1} x_{1i}) / n_1\overline{x}_2 = (\sum_{j=1}^{n_2} x_{2j}) / n為二群樣本各自的平均數,s^2_1 = (\sum_{i=1}^n (x_{1i}-\overline{x}_1)^2)/(n_1 - 1)s^2_2 = (\sum_{j=1}^n (x_{2j}-\overline{x}_2)^2)/(n_2 - 1)分別為二群樣本之變異數。該統計量t在零假說:μ1 - μ2 = μ0為真的條件下服從自由度為

 df = \frac{ (s_1^2/n_1 + s_2^2/n_2)^2 }{ (s_1^2/n_1)^2/(n_1-1) + (s_2^2/n_2)^2/(n_2-1) }

t分佈。這種方法又常稱為Welch檢驗。

簡單線性迴歸之斜率[编辑]

在簡單線性迴歸的模型

 y_i = \alpha + \beta x_i + \varepsilon_i,

其中xii = 1, ..., n為已知,αβ為未知係數,εi殘差獨立且服從期望值0且變異數σ2未知的常態分佈,yii = 1, ..., n為觀測值。我們可以檢驗迴歸係數(在此例即為迴歸式之斜率)β是否相等於特定的β0(通常使β0 = 0以檢驗xiyi是否有關聯)。

\widehat\alpha\widehat\beta最小平方法之估計值,SE_{\widehat\alpha}SE_{\widehat\beta}為最小平方法估計值之標準誤差,則


t = \frac{\widehat\beta - \beta_0}{ SE_{\widehat\beta} }\sim\mathcal{T}_{n-2}

在零假設為β = β0的情況下服從自由度為n − 2之t分佈,其中


SE_{\widehat\beta} = \frac{\sqrt{\frac{1}{n - 2}\sum_{i=1}^n (y_i - \widehat y_i)^2}}{\sqrt{ \sum_{i=1}^n (x_i - \overline{x})^2 }}

由於 
\widehat\varepsilon_i = y_i - \widehat y_i = y_i - (\widehat\alpha + \widehat\beta x_i)
為殘差(即估計誤差),而 
\text{SSR} = \sum_{i=1}^n \widehat\varepsilon_i^{\;2}
為殘差之離均平方和,我們可改寫t

 t = \frac{(\widehat\beta - \beta_0)\sqrt{n-2}}{ \sqrt{\text{SSR}/\sum_{i=1}^n \left(x_i - \overline{x}\right)^2} }

電腦軟體[编辑]

大多數的試算表軟體及統計軟體,諸如QtiPlotOpenOffice.org CalcLibreOffice CalcMicrosoft ExcelSASSPSSStataDAPgretlRPython ([1])、PSPPMinitab等,都可以進行t檢驗之運算。

軟體或程式語言 函數
Microsoft Excel TTEST() [2]
OpenOffice.orgLibreOffice TTEST()
Python scipy.stats.ttest_ind() [3]
R t.test()

參考文獻[编辑]

  1. ^ Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
  2. ^ 2.0 2.1 O'Connor, John J.; Robertson, Edmund F., Gosset, MacTutor History of Mathematics archive 
  3. ^ Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. doi:10.1214/ss/1177013437. JSTOR 2245613. 
  4. ^ http://www.aliquote.org/cours/2012_biomed/biblio/Student1908.pdf