本頁使用了標題或全文手工轉換

假設檢定

維基百科,自由的百科全書
前往: 導覽搜尋

假設檢定推論統計中用於檢驗統計假設的一種方法。而「統計假設」是可通過觀察一組隨機變量的模型進行檢驗的科學假說[1]一旦能估計未知參數,就會希望根據結果對未知的真正參數值做出適當的推論。

統計上對參數的假設,就是對一個或多個參數的論述。而其中欲檢驗其正確性的為零假設(null hypothesis),零假設通常由研究者決定,反應研究者對未知參數的看法。相對於零假設的其他有關參數之論述是對立假設英語alternative hypothesis(alternative hypothesis),它通常反應了執行檢定的研究者對參數可能數值的另一種(對立的)看法(換句話說,對立假設通常才是研究者最想知道的)。

假設檢定的種類包括:t檢驗Z檢驗英語Z-test卡方檢驗F檢驗等等。

說明[編輯]

假設檢定的過程,可以用法庭的審理來說明。先想像現在法庭上有一名被告,假設該被告是清白的,而檢察官必須要提出足夠的証據去証明被告的確有罪。 在証明被告有罪前,被告是被假設為清白的。

而檢察官提出的証據,是否足以確定該被告有罪,則要經過檢驗。 這樣子的檢驗過程就相當於用T檢驗或Z檢驗去檢視研究者所搜集到的統計資料。

檢驗過程[編輯]

在統計學的文獻中,假設檢定發揮了重要作用。假設檢定大致有如下步驟:

  1. 最初研究假設為真相不明。
  2. 第一步是提出相關的零假設和對立假設。這是很重要的,因為錯誤陳述假設會導致後面的過程變得混亂。
  3. 第二步是考慮檢驗中對樣本做出的統計假設;例如,關於獨立性的假設或關於觀測數據的分布的形式的假設。這個步驟也同樣重要,因為無效的假設將意味著試驗的結果是無效的。
  4. 決定哪個檢測是合適的,並確定相關檢驗統計量英語Test statistic T
  5. 在零假設下推導檢驗統計量的分布。在標準情況下應該會得出一個熟知的結果。比如檢驗統計量可能會符合學生t-分布常態分布
  6. 選擇一個顯著性水平 (α),若低於這個機率閾值,就會拒絕零假設。最常用的是 5% 和 1%。
  7. 根據在零假設成立時的檢驗統計量T分布,找到數值最接近對立假設,且機率為顯著性水平 (α)的區域,此區域稱為「拒絕域」,意思是在零假設成立的前提下,落在拒絕域的機率只有α。
  8. 針對檢驗統計量T,根據樣本計算其估計值tobs
  9. 若估計值tobs未落在「拒絕域」,接受零假設。若估計值tobs落在「拒絕域」,拒絕零假設,接受對立假設。

例子[編輯]

淑女品茶英語Lady tasting tea是一個有關假設檢定的著名例子[2],費雪的一個女同事聲稱可以判斷在奶茶中,是先加入茶還是先加入牛奶。費雪提議給她八杯奶茶,四杯先加茶,四杯先加牛奶,但隨機排列,而女同事要說出這八杯奶茶中,哪些先加牛奶,哪些先加茶,檢驗統計量英語Test statistic是確認正確的次數。零假設是女同事無法判斷奶茶中的茶先加入還是牛奶先加入,對立假設為女同事有此能力。

若單純以機率考慮(即女同事沒有判斷的能力)下,八杯都正確的機率為1/70,約1.4%,因此「拒絕域」為八杯的結果都正確。而測試結果為女同事八杯的結果都正確[3],在統計上是相當顯著的的結果。

相關條目[編輯]

參考文獻[編輯]

  1. ^ Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model (Edward Arnold) §20.2.
  2. ^ Fisher, Sir Ronald A. Mathematics of a Lady Tasting Tea. (編) James Roy Newman. The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. 1956 [1935]. ISBN 978-0-486-41151-4.  Originally from Fisher's book Design of Experiments.
  3. ^ Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.