二項式分布

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書
(重新導向自二項分佈
二項分布
機率質量函數
Probability mass function for the binomial distribution
累積分布函數
Cumulative distribution function for the binomial distribution
記號 B(n, p)
參數 試驗次數 (整數)
成功概率 (實數)
值域
機率質量函數
累積分布函數
期望值
中位數 之一
眾數
變異數
偏度
峰度
動差母函數
特徵函數

概率論統計學中,二項分布(英語:Binomial distribution)是獨立的是/非試驗中成功的次數的離散概率分布,其中每次試驗的成功概率。這樣的單次成功/失敗試驗又稱為伯努利試驗。實際上,當時,二項分布就是伯努利分布。二項分布是顯著性差異二項試驗的基礎。

詳述[編輯]

概率質量函數[編輯]

一般來說,若隨機變量服從參數為的二項分布,我們記作。n次試驗中正好得到k次成功的概率由概率質量函數給出:

對於,其中

二項式係數(這就是二項分布的名稱的由來),又記為,或。該公式可以用以下方法理解:我們希望有次成功(機率為)和次失敗(機率為)。然而,次成功可以在次試驗的任何地方出現,而把次成功分布在次試驗中共有個不同的方法。

在製造二項分布概率的參考表格時,通常表格中只填上個值。這是因為時的概率可以從它的補集計算出:

因此,我們要看另外一個和另外一個(二項分布一般不是對稱的)。然而,它的表現不是任意的。總存在一個整數,滿足:

作為的函數,表達式時單調遞增,時單調遞減,只有當是整數時例外。在這時,有兩個值使達到最大:是伯努利試驗的最可能的結果,稱為眾數。注意它發生的概率可以很小。

累積分布函數(概率分布函數)[編輯]

累積分布函數可以表示為:

其中是小於或等於最大整數

它也可以用正則化不完全貝塔函數來表示:

期望和方差[編輯]

如果(也就是說,是服從二項分布的隨機變量),那麼期望值

方差

這個事實很容易證明。首先假設有一個伯努利試驗。試驗有兩個可能的結果:1和0,前者發生的概率為,後者的概率為。該試驗的期望值等於。該試驗的方差也可以類似地計算:.

一般的二項分布是次獨立的伯努利試驗的和。它的期望值和方差分別等於每次單獨試驗的期望值和方差的和:[1]


眾數和中位數[編輯]

通常二項分布眾數等於,其中 取整函數。然而,當是整數且不等於0或1時,分布有兩個眾數:。當等於0或1時,眾數相應地等於0或。這些情況可以綜述如下:

一般地,沒有一個單一的公式可以求出二項分布的中位數,甚至中位數可能是不唯一的。然而有幾個特殊的結果:

  • 如果是整數,那麼平均數、中位數和眾數相等,都等於[2][3]
  • 任何中位數都位於區間內。[4]
  • 中位數不能離平均數太遠:[5]
  • 如果,或,或(除了是奇數的情況以外),那麼中位數是唯一的,且等於[4][5]
  • 如果,且是奇數,那麼區間中的任何數都是二項分布的中位數。如果是偶數,那麼是唯一的中位數。

兩個二項分布的協方差[編輯]

如果有兩個服從二項分布的隨機變量,我們可以求它們的協方差。利用協方差的定義,當時我們有

第一項僅當都等於1時非零,而分別為的概率。定義都等於1的概率,便得到

對於n次獨立的試驗,我們便有

如果是相同的變量,便化為上面的方差公式。

與其他分布的關係[編輯]

二項分布的和[編輯]

如果,且相互獨立,那麼也服從二項分布;它的分布為

伯努利分布[編輯]

伯努利分布是二項分布在時的特殊情況。的意思是相同的。相反,任何二項分布都是次獨立伯努利試驗的和,每次試驗成功的概率為

泊松二項分布[編輯]

二項分布是泊松二項分布的一個特殊情況。泊松二項分布次獨立、不相同的伯努利試驗()的和。如果服從泊松二項分布,且,那麼

正態近似[編輯]

時的二項分布以及正態近似

如果足夠大,那麼分布的偏度就比較小。在這種情況下,如果使用適當的連續性校正,那麼的一個很好的近似是正態分布

越大(至少30),近似越好,當不接近0或1時更好。[6]不同的經驗法則可以用來決定是否足夠大,以及是否距離0或1足夠遠:

  • 一個規則是都必須大於5。

泊松近似[編輯]

當試驗的次數趨於無窮大,而乘積固定時,二項分布收斂於泊松分布。因此參數為的泊松分布可以作為二項分布的近似,如果足夠大,而足夠小。[7]

極限[編輯]

  • 趨於趨於0,而固定於,或至少趨於時,二項分布趨於期望值為λ的泊松分布
  • 趨於固定時,
的分布趨於期望值為 0、方差為 1的正態分布。這個結果是中心極限定理的一個特殊情況。

例子[編輯]

一個簡單的例子如下:擲一枚骰子十次,那麼擲得4的次數就服從的二項分布。

參見[編輯]

參考文獻[編輯]

  1. ^ 第6章 數學附錄 (PDF). [2023-11-07]. (原始內容存檔 (PDF)於2023-11-07). 
  2. ^ Neumann, P. Über den Median der Binomial- and Poissonverteilung. Wissenschaftliche Zeitschrift der Technischen Universität Dresden. 1966, 19: 29–33 (德語). 
  3. ^ Lord, Nick. (July 2010). "Binomial averages when the mean is an integer", The Mathematical Gazette 94, 331-332.
  4. ^ 4.0 4.1 Kaas, R.; Buhrman, J.M. Mean, Median and Mode in Binomial Distributions. Statistica Neerlandica. 1980, 34 (1): 13–18. doi:10.1111/j.1467-9574.1980.tb00681.x. 
  5. ^ 5.0 5.1 Kais Hamza. The smallest uniform upper bound on the distance between the mean and the median of the binomial and Poisson distributions. Statistics & Probability Letters: 21–25. [2018-04-02]. doi:10.1016/0167-7152(94)00090-u. (原始內容存檔於2020-12-15). 頁面存檔備份,存於網際網路檔案館
  6. ^ Box, Hunter and Hunter. Statistics for experimenters. Wiley. 1978: 130. 
  7. ^ NIST/SEMATECH, "6.3.3.1. Counts Control Charts"頁面存檔備份,存於網際網路檔案館), e-Handbook of Statistical Methods.