負二項式分布

負二項分布
不同來源對負二項分布的定義略有差異：隨機變量的最小可能取值可能是（僅計失敗的次數，或反之），亦可能是（總次數，不論成敗）；參數可能表示每次試驗成功的概率，也可能表示失敗的概率；試驗的終止條件可能是成功次或失敗次。
	機率質量函數紅線是平均值; 綠線是標準差;
參數	(實); （實）
值域
機率質量函數
累積分佈函數
期望值
眾數	;
變異數
偏度
峰度
動差母函數
特徵函數

負二項分布（Negative binomial distribution）是統計學上一種描述在一系列獨立同分佈的伯努利試驗中，成功次數達到指定次數（記為 $r$ ）時失敗次數的離散機率分佈。比如，如果我們定義擲骰子隨機變量 $x$ 值為 $x=1$ 時成功，所有 $x\neq 1$ 為失敗，這時我們反覆擲骰子直到1出現3次（成功次數 $r=3$ ），此時非1數字出現次數的機率分佈即為負二項分布。

帕斯卡分佈（Pascal distribution，來自布萊茲·帕斯卡 (Blaise Pascal)）和波利亞分佈（Polya distribution，又稱罐子模型，來自喬治·波利亞 (George Pólya)）均是負二項分布的特例。在工程、氣候等領域中經常用「負二項分布」或「帕斯卡分佈」來描述變量 $r$ 為整數的情況，而使用「波利亞分佈」來描述 $r$ 取到實數值 $R$ 的情況。

對於「相關的離散事件」（"associated discrete events"）的發生，例如龍捲風爆發，相比於泊松分佈，波利亞分佈由於允許其平均值和方差不同，而能夠給出更精確的模型。在流行病學中，它已被用於模擬傳染病的疾病傳播，其中可能的繼發感染數量可能因個體和環境而異^[2]。更一般地說，由於正協方差項，事件具有正相關的事件導致比獨立事件更大的方差可能是合適的。

「負二項分布」與「二項分佈」的區別在於：「二項分佈」是固定試驗總次數 $N$ 的獨立試驗中，成功次數k的分佈；而「負二項分布」是所有到r次成功時即終止的獨立試驗中，失敗次數k的分佈。

術語「負二項式」可能是因為出現在分佈的機率質量函數公式中的某個二項式系數可以用負數更簡單地寫出^[3]。

定義

若每次伯努利試驗有兩種可能的結果，分別為成功或者失敗。在每次試驗中，成功的機率為 $p$ ，失敗的機率為 $1-p$ 。反覆進行該伯努利試驗，直到觀察到第 $r$ 次成功發生。此時試驗失敗次數 $X$ 的分佈即為負二項分布（或稱帕斯卡分佈），那麼：

若隨機變量 ${\mathit {X}}$ 服從參數為 ${\mathit {r}}$ 和 ${\mathit {p}}$ 的負二項分布，則記為 $X\sim NB(r,p)$ .

在實際生活中，我們可以使用負二項分布描述某種機器在壞掉前，能夠工作的天數的分佈。此時，「成功」的事件可以指機器正常工作一天，「失敗」的事件可以指機器故障的一天。如果我們使用負二項分布來描述運動員在獲取r個獎牌前嘗試的次數的分佈，此時，「失敗」的事件指運動員的一次嘗試，「成功」的事件指運動員獲取一枚獎牌。如果使用負二項分布來描述擲一枚硬幣出現r次正面前，出現硬幣反面的次數的分佈，「成功」的事件指出現硬幣的正面，「失敗」的事件指出現硬幣的反面。

機率質量函數

帕斯卡分佈

當 $r$ 是整數時的負二項分布又稱帕斯卡分佈，其機率質量函數為：

$f(k;r,p)\equiv \Pr(X=k)={\binom {k+r-1}{r-1}}p^{r}(1-p)^{k}\quad {\text{for }}k=0,1,2,\dotsc$

其中 $k$ 是失敗的次數， $r$ 是成功的次數， $p$ 是事件成功的機率。在負二項分布的機率質量函數中，由於 $k+r$ 次伯努利試驗為獨立同分佈，每個成功 $r$ 次、失敗 $k$ 次的事件的機率為 $p^{r}(1-p)^{k}$ 。由於第 $r$ 次成功一定是最後一次試驗，所以應該在 $k+r-1$ 次試驗中選擇 $r-1$ 次成功，使用排列組合二項系數獲取所有可能的選擇數。

二項系數與負二項名稱來源

括號中為二項式系數表達式：

{\binom {k+r-1}{r-1}}={\frac {(k+r-1)!}{k!\,(r-1)!}}={\frac {(k+r-1)(k+r-2)\dotsm (r)}{k!}}

該表達式可以寫成帶負值參數的二項系數的形式，如下式所示，解釋了「負二項」名稱的來源：

{\begin{aligned}&{\frac {(k+r-1)\dotsm (r)}{k!}}\\[6pt]={}&(-1)^{k}{\frac {(-r)(-r-1)(-r-2)\dotsm (-r-k+1)}{k!}}=(-1)^{k}{\binom {-r}{k}}.\end{aligned}}

機率質量函數對所有可能k值求和為1

帕斯卡分佈機率質量函數 $f(k;r,p)$ 對所有可能 $k$ 值求和，一定等於1：

$\sum _{k=0}^{\infty }{\binom {k+r-1}{k}}p^{r}q^{k}=1$

證明如下：

$1=p^{r}p^{-r}=p^{r}(1-q)^{-r}=p^{r}\sum _{k=0}^{\infty }{\binom {-r}{k}}(-q)^{k}=p^{r}\sum _{k=0}^{\infty }(-1)^{k}{\binom {-r}{k}}q^{k}=\sum _{k=0}^{\infty }{\binom {k+r-1}{k}}p^{r}q^{k}$

其中第三步用到了二項序列展開。

幾何分佈

取 $r=1$ ，負二項分布等於幾何分佈。其機率質量函數為 $f(k;1,p)=p\cdot (1-p)^{k}\!$ 。

例子

舉例說，若我們擲骰子，擲到一即視為成功。則每次擲骰的成功率是 ${\frac {1}{6}}$ 。要擲出三次一，所需的擲骰次數屬於集合{ 3, 4, 5, 6, ... }。擲到三次一的擲骰次數是負二項分布的隨機變量。要在第三次擲骰時，擲到第三次一，則之前兩次都要擲到一，其機率為 $({\frac {1}{6}})^{3}$ 。注意擲骰是伯努利試驗，之前的結果不影響隨後的結果。

若要在第四次擲骰時，擲到第三次一，則之前三次之中要有剛好兩次擲到一，在三次擲骰中擲到2次1的機率為 ${3 \choose 3-1}\left({5 \over 6}\right)\left({1 \over 6}\right)^{2}$ 。第四次擲骰要擲到一，所以要將前面的機率再乘 ${\frac {1}{6}}$ ： ${(1+3)-1 \choose 3-1}\left({1 \over 6}\right)^{3}\left({5 \over 6}\right)$ 。

參見

參考文獻

^ DeGroot, Morris H. Probability and Statistics Second. Addison-Wesley. 1986: 258–259. ISBN 0-201-11366-X. LCCN 84006269. OCLC 10605205.
^ e.g. J.O. Lloyd-Smith, S.J. Schreiber, P.E. Kopp, and W.M. Getz (2005), Superspreading and the effect of individual variation on disease emergence, Nature, 438, 355–359. doi:10.1038/nature04153
The overdispersion parameter is usually denoted by the letter $k$ in epidemiology, rather than $r$ as here.
^ Casella, George; Berger, Roger L. Statistical inference 2nd. Thomson Learning. 2002: 95. ISBN 0-534-24312-6.

[DeGrootNB-1] DeGroot, Morris H. Probability and Statistics Second. Addison-Wesley. 1986: 258–259. ISBN 0-201-11366-X. LCCN 84006269. OCLC 10605205.

[2] .g. J.O. Lloyd-Smith, S.J. Schreiber, P.E. Kopp, and W.M. Getz (2005), Superspreading and the effect of individual variation on disease emergence, Nature, 438, 355–359. doi:10.1038/nature04153
The overdispersion parameter is usually denoted by the letter $k$ in epidemiology, rather than $r$ as here.

[3] Casella, George; Berger, Roger L. Statistical inference 2nd. Thomson Learning. 2002: 95. ISBN 0-534-24312-6.

[1]

[2]

[3]

不同來源對負二項分布的定義略有差異：隨機變量的最小可能取值可能是 $k=0$ （僅計失敗的次數，或反之），亦可能是 $k=r$ （總次數，不論成敗）；參數 $p$ 可能表示每次試驗成功的概率，也可能表示失敗的概率；試驗的終止條件可能是成功 $r$ 次或失敗 $r$ 次。^[1]
機率質量函數紅線是平均值綠線是標準差
參數	$r>0\!$ (實) $0<p<1\!$ （實）
值域	$k\in \{0,1,2,\ldots \}\!$
機率質量函數	${\frac {\Gamma (r+k)}{k!\,\Gamma (r)}}\,p^{r}\,(1-p)^{k}\!$
累積分佈函數	$I_{p}(r,k+1)$
期望值	$r\,{\frac {1-p}{p}}\!$
眾數	$\lfloor (r-1)\,(1-p)/p\rfloor {\text{ if }}r>1$ $0{\text{ if }}r\leq 1$
變異數	$r\,{\frac {1-p}{p^{2}}}\!$
偏度	${\frac {2-p}{\sqrt {r\,(1-p)}}}\!$
峰度	${\frac {6}{r}}+{\frac {p^{2}}{r\,(1-p)}}\!$
動差母函數	$\left({\frac {p}{1-(1-p)e^{t}}}\right)^{r}\!$
特徵函數	$\left({\frac {p}{1-(1-p)e^{i\,t}}}\right)^{r}\!$

定義