假设检验

本页使用了标题或全文手工转换
维基百科,自由的百科全书
(重定向自假設檢定

假设检验(英语:hypothesis testing)是推论统计中用于检验现有数据是否足以支持特定假设的方法。[1]一旦能估计未知参数,就会希望根据结果对未知的真正参数值做出适当的推论。

一张包含零假设与备择假设两个曲线的示意图,两正态分布有不同的期望值与相同的方差

欲检验统计上假设的正确性的为零假设(Null hypothesis,记为),零假设通常由研究者决定,反映研究者对未知参数的看法。相对于零假设的其他有关参数之论述是备择假设(Alternative hypothesis,记为),它通常反应了执行检验的研究者对参数可能数值的另一种(对立的)看法(换句话说,备择假设通常才是研究者最想证明的)。

假设检验的种类包括:t检验Z检验卡方检验F检验等等。

说明[编辑]

假设检验的过程,可以用法庭的审理来说明。先想像现在法庭上有一名被告,假设该被告是清白的,而检察官必须要提出足够的证据去证明被告的确有罪。

在证明被告有罪前,被告是被假设为清白的。

  • 假设被告清白的假设,就相当于零假设
  • 假设被告有罪的假设,则是备择假设

而检察官提出的证据,是否足以确定该被告有罪,则要经过检验。这样子的检验过程就相当于用T检验Z检验去检视研究者所搜集到的统计资料。

检验过程[编辑]

在统计学的文献中,假设检验发挥了重要作用。假设检验大致有如下步骤:

  1. 最初研究假设为真相不明。
  2. 提出相关的零假设备择假设
  3. 考虑检验中对样本做出的统计假设;例如,关于总体资料的分布形式或关于独立性的假设。无效的假设将意味此检验的结果是无效的。
  4. 选择一个显著性水平α),若低于这个概率阈值,就拒绝零假设。最常用的是5%和1%。
  5. 选择适合的检验统计量(Test statistic)T
  6. 在设定零假设为真下推导检验统计量的分布。在标准情况下应该会得出一个熟知的结果。比如检验统计量可能会符合正态分布司徒顿t分布
  7. 根据在零假设成立时的检验统计量T分布,找到概率为显著性水平 (α)的区域,此区域称为“拒绝域”(记作RR或CR),即在零假设成立的前提下,落在拒绝域的概率只有α。
  8. 针对检验统计量T,根据样本计算其估计值tobs
  9. 若估计值tobs未落在拒绝域,则“不拒绝”零假设(do no reject )。若估计值tobs落在拒绝域,则拒绝零假设,接受备择假设。

要注意的是一般不会将检验结果称作“接受”零假设,而是因没有显著证据证明零假设为非,所以“不拒绝”零假设。

例子[编辑]

女士品茶是一个有关假设检验的著名例子[2]。统计学家费希尔的一个女同事,也是藻类学家的缪丽·布里斯托尔英语Muriel Bristol,她声称可以判断在奶茶中是先加入茶还是先加入牛奶。费希尔提议给她八杯奶茶。缪丽已知其中四杯先加茶,四杯先加牛奶,但随机排列,而她要说出这八杯奶茶中,哪些先加牛奶,哪些先加茶,检验统计量英语Test statistic是确认正确的次数。零假设是她无法判断奶茶中的茶先加入还是牛奶先加入,备择假设为她有此能力。

若单纯以概率考虑(即缪丽没有判断的能力)下,八杯都正确的概率为1/70(因为8选4的组合数是70),约1.43%,因此“拒绝域”为八杯的结果都正确。而测试结果为缪丽八杯的结果都正确[3],在统计上是相当显著的的结果。也就是说,几乎可以排除她只是恰好猜对结果的可能。

相关条目[编辑]

参考文献[编辑]

  1. ^ Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model (Edward Arnold) §20.2.
  2. ^ Fisher, Sir Ronald A. Mathematics of a Lady Tasting Tea. James Roy Newman (编). The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. 1956 [1935]. ISBN 978-0-486-41151-4.  Originally from Fisher's book Design of Experiments.
  3. ^ Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.