女士品茶：修订间差异

删除的内容添加的内容

行内

2022年12月20日 (二) 08:33的版本

在统计实验的设计中，女士品茶是羅納德·愛爾默·費雪（Ronald Fisher）设计的随机实验，并在他的《实验设计》（The Design of Experiments，1935）一书中得到记录。^[1]該實驗是費雪對虛無假設「從未被證明或建立，但可能在實驗過程中被推翻」概念的原始闡述。^[1]

受试者是费舍尔的同事，也是一位藻类学家缪丽·布里斯托尔（英语：Muriel Bristol），她声称能够辨别冲茶时先放的是茶还是牛奶。费舍尔提出随机给她8杯茶，其中4杯先放茶，4杯先放牛奶，然后便可知道她碰巧猜对特定杯数的可能性。

费舍尔的描述只有不到10页，以其在术语、计算和实验设计方面的简洁和完整而著称。^[2]该示例大致基于费舍尔生活中的一个事件。使用的测试是费希尔精确检验（英语：Fisher's exact test）。

實驗內容

事先準備八杯奶茶，其中四杯先加牛奶再加入茶，另外四杯先加茶再加牛奶，共有兩種沖泡方式。之後由受試者以隨機順序試喝八杯奶茶。過程中，受試者可以多次試喝同一杯茶以前後比較，並已經明確知曉兩種沖泡方法的茶各有四杯。最終由受試者回答每杯茶分別屬於何種沖泡方式。

這項檢驗的虛無假說是受測者並沒有任何能力區別沖泡方法。在費雪的方法中並沒有對立假說，^[1]不同於內曼–皮爾遜引理（英语：Neyman–Pearson lemma）的方法。

統計檢定量的形式很簡單，是受測者正確地選出其中一項沖泡方式（例如先加牛奶再加茶）的次數。也就是說，受測者從八杯中選出四杯屬於先加牛奶再加茶者，再事後比對該四杯中有幾杯確實屬於先加牛奶再加茶。在此例中要求受測者從八杯茶選出四杯茶，可利用n = 8且k = 4的組合數計算所有可能的70種組合：

{\binom {8}{4}}={\frac {8!}{4!(8-4)!}}=70

並可區分為0至4杯正確，共五種情況：

各種正確次數對應的組合數。
正確次數	組合數
0正確	${\binom {4}{0}}\times {\binom {4}{4-0}}={\frac {4!}{4!\times 0!}}\times {\frac {4!}{0!\times 4!}}=1$
1正確	${\binom {4}{1}}\times {\binom {4}{4-1}}={\frac {4!}{3!\times 1!}}\times {\frac {4!}{1!\times 3!}}=16$
1正確	${\binom {4}{2}}\times {\binom {4}{4-2}}={\frac {4!}{2!\times 2!}}\times {\frac {4!}{2!\times 2!}}=36$
3正確	${\binom {4}{3}}\times {\binom {4}{4-3}}={\frac {4!}{1!\times 3!}}\times {\frac {4!}{3!\times 1!}}=16$
4正確	${\binom {4}{4}}\times {\binom {4}{4-4}}={\frac {4!}{0!\times 4!}}\times {\frac {4!}{4!\times 0!}}=1$
總和	70

上述正確次數所對應的組合次數有以下關係；若是0次正確，很明顯地僅對應一種情況，即受測者完全錯誤地挑出其中四杯茶；若是1次正確，表示受測者僅正確挑出四杯中的一杯（共 ${\binom {4}{1}}=4$ 種情況），同時錯誤地挑出四杯中的三杯（共 ${\binom {4}{3}}=4$ 種情況）為獨立事件，故共有4 × 4 = 16種情況；以此類推。這顯示了正確次數的機率分布屬於超幾何分布。具體而言，服從超幾何分布的隨機變數X，

X\sim \operatorname {Hypergeometric} (n=4,K=4,N=8)

其中n則表示抽出次數，K表示有幾杯屬於先加牛奶再加茶的沖泡方式，N表示總共的茶杯數。此例中，令k=4表示選出4杯茶，可以發現，楊輝三角形的第k列的平方正好是從2k個選擇中做出k個選擇的組合數。

若虛無假說（即受測者不能區別沖泡方式）為真，在型一錯誤率上限5%的設定下，此例應拒絕虛無假設（受測者無法區別沖泡方式）的拒絕域僅包括了受測者達成「4成功」結果。這是因為在所有70種情況下，發生「4成功」結果的機率為1/70（約0.0143），但發生「4成功」或「3成功」的機率則(16 + 1) / 70（約0.243），超過先前設定的型一錯誤率上限。因此，唯有當受測者完全正確地挑出屬於先加牛奶再加茶的4杯茶，費雪才接受測者有區別沖泡方式的能力，但並沒有量化受測者的區別能力。

費雪在書中亦討論了增加測試杯數與重複測試對檢驗的益處。例如，增加茶杯數至12杯（二種沖泡方式各6杯），或是原本8杯的實驗重覆進行二次，則可以提高檢驗的檢定力而更敏感地偵測出能夠區別沖泡方式的受測者。^[1]

戴維·薩爾斯伯格（英语：David Salsburg）報道了費雪的同事費爾菲爾德·史密斯（H. Fairfield Smith）透露了故事的結尾：該女士確實在實驗中由八杯茶中完全正確地區別每杯茶的沖泡方式。^[3]^[4]縱使受測者完全用猜的，也只有1/70的機率全部猜中。

图书《女生品茶》

由戴維·薩爾斯伯格（英语：David Salsburg）撰寫的統計學科普書藉便以此例題為其書名：《女士品茶：統計學如何變革了科學和生活（英语：The Lady Tasting Tea）》，^[3]其中讲述了费舍尔的实验以及随机化（英语：randomization）的思路。

反響

德巴布拉塔·巴蘇（英语：Deb Basu）評價道「『女士品茶』这一知名案例是实验数据随机化分析的两大支柱之一……」。 ^[5]^[6]

参见

参考文献

^ ^1.0 ^1.1 ^1.2 ^1.3 Fisher, R. A. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment. The Design of Experiments 9. ed. New York: Hafner Press. 1974. ISBN 0-02-844690-9. OCLC 471778573.
^ Newman, James R. Mathematics of a Lady Tasting Tea. The world of mathematics. Mineola, N.Y.: Dover Publications. <2000->. ISBN 978-0-486-41153-8. OCLC 43555029. 请检查|date=中的日期值 (帮助)
^ ^3.0 ^3.1 Salsburg, David. The lady tasting tea: how statistics revolutionized science in the twentieth century. New York: W.H. Freeman. 2001. ISBN 0-7167-4106-7. OCLC 45129162.
^ Box, Joan Fisher. R.A. Fisher : the life of a scientist. New York, NY. 1978: 134. ISBN 0-471-09300-9. OCLC 3649815.
^ Basu, D. Randomization Analysis of Experimental Data: The Fisher Randomization Test. Journal of the American Statistical Association. 1980-09, 75 (371). ISSN 0162-1459. doi:10.1080/01621459.1980.10477512 （英语）.
^ Ghosh, J. K. The Fisher Randomization Test. Ghosh, J. K. (编). Statistical Information and Likelihood 45. New York, NY: Springer New York. 1988: 271–289. ISBN 978-0-387-96751-6. doi:10.1007/978-1-4612-3894-2_15.

[fisher1935-1] 1.0 ^1.1 ^1.2 ^1.3 Fisher, R. A. The Principles of Experimentation, Illustrated by a Psycho-physical Experiment. The Design of Experiments 9. ed. New York: Hafner Press. 1974. ISBN 0-02-844690-9. OCLC 471778573.

[2] Newman, James R. Mathematics of a Lady Tasting Tea. The world of mathematics. Mineola, N.Y.: Dover Publications. <2000->. ISBN 978-0-486-41153-8. OCLC 43555029. 请检查|date=中的日期值 (帮助)

[S2002-3] 3.0 ^3.1 Salsburg, David. The lady tasting tea: how statistics revolutionized science in the twentieth century. New York: W.H. Freeman. 2001. ISBN 0-7167-4106-7. OCLC 45129162.

[4] Box, Joan Fisher. R.A. Fisher : the life of a scientist. New York, NY. 1978: 134. ISBN 0-471-09300-9. OCLC 3649815.

[5] Basu, D. Randomization Analysis of Experimental Data: The Fisher Randomization Test. Journal of the American Statistical Association. 1980-09, 75 (371). ISSN 0162-1459. doi:10.1080/01621459.1980.10477512 （英语）.

[6] Ghosh, J. K. The Fisher Randomization Test. Ghosh, J. K. (编). Statistical Information and Likelihood 45. New York, NY: Springer New York. 1988: 271–289. ISBN 978-0-387-96751-6. doi:10.1007/978-1-4612-3894-2_15.

[1]

[2]

[3]

[4]

[5]

[6]

@@ 第48行： / 第48行： @@
 == 图书《女生品茶》 ==
-由{{link-en|戴維·薩爾斯伯格|David Salsburg}}撰寫的統計學[[科普]]書藉便以此例題為其書名：《{{link-en|女士品茶：統計學如何變革了科學和生活 (2002)|The Lady Tasting Tea|女士品茶：統計學如何變革了科學和生活}}》，<ref name = "S2002" />其中讲述了费舍尔的实验以及{{Link-en|随机化|randomization}}的思路。Deb Basu评价说，“‘女士品茶’这一知名案例”是“实验数据随机化分析……的两大支柱之一”。
+由{{link-en|戴維·薩爾斯伯格|David Salsburg}}撰寫的統計學[[科普]]書藉便以此例題為其書名：《{{link-en|女士品茶：統計學如何變革了科學和生活 (2002)|The Lady Tasting Tea|女士品茶：統計學如何變革了科學和生活}}》，<ref name = "S2002" />其中讲述了费舍尔的实验以及{{Link-en|随机化|randomization}}的思路。
+== 反響 ==
+{{link-en|德巴布拉塔·巴蘇|Deb Basu}}評價道「『女士品茶』这一知名案例是实验数据随机化分析的两大支柱之一……」。
+<ref>{{Cite journal |last=Basu |first=D. |date=1980-09 |title=Randomization Analysis of Experimental Data: The Fisher Randomization Test |url=http://www.tandfonline.com/doi/abs/10.1080/01621459.1980.10477512 |journal=Journal of the American Statistical Association |language=en |volume=75 |issue=371 |doi=10.1080/01621459.1980.10477512 |issn=0162-1459}}</ref><ref>{{Cite book|chapter=The Fisher Randomization Test|title=Statistical Information and Likelihood|url=http://link.springer.com/10.1007/978-1-4612-3894-2_15|publisher=Springer New York|date=1988|location=New York, NY|isbn=978-0-387-96751-6|pages=271–289|volume=45|doi=10.1007/978-1-4612-3894-2_15|first=J. K.|last=Ghosh|editor-first=J. K.|editor-last=Ghosh}}</ref>
 ==参见==