概率質量函數
在機率論和統計學中,機率質量函數(probability mass function,簡寫作pmf)是離散隨機變數在各特定取值上的機率[1]。有時它也被稱為離散密度函數。 機率密度函數通常是定義離散機率分布的主要方法,並且此類函數存在於其定義域是離散的標量變數或多元隨機變數。
機率質量函數和機率密度函數的一個不同之處在於:機率質量函數是對離散隨機變數定義的,本身代表該值的機率;機率密度函數本身不是機率,只有對連續隨機變數的機率密度函數必須在某一個區間內被積分後才能產生出機率[2]。
具有最大機率密度的隨機變數的值稱為眾數。
數學定義
[編輯]假設X是一個定義在可數樣本空間S上的離散隨機變數 S ⊆ R,則其機率質量函數 fX(x) 為
注意這在所有實數上,包括那些X不可能等於的實數值上,都定義了 fX(x)。在那些X不可能等於的實數值上, fX(x)取值為0 ( x ∈ R\S,取Pr(X = x) 為0)。
離散隨機變數機率質量函數的不連續性決定了其累積分布函數也不連續。
例子
[編輯]機率質量函數可以定義在任何離散隨機變數上,包括常數分布, 二項分布(包括伯努利(Bernoulli)分布), 負二項分布, 泊松(Poisson)分布, 幾何分布以及超幾何分布隨機變數上.
有限
[編輯]存在三個相關的主要分布,伯努利分布、二項式分布、和幾何分佈。
伯努利分布
[編輯]伯努利分布:ber(p) ,用於對只有兩種可能結果的實驗進行建模。 這兩個結果通常編碼為1和0。
一個伯努利分布的例子是拋硬幣。假設X是拋硬幣的結果,反面取值為0,正面取值為1。則在狀態空間{0, 1}(這是一個伯努利(Bernoulli)隨機變量)中,X = x的機率是0.5,所以機率質量函數是
無限
[編輯]以下呈指數下降的分布是具有無限數量可能結果的分布示例——所有正整數:
儘管可能的結果有無限多,但總機率密度為 1/2 + 1/4 + 1/8 +⋯ = 1,滿足機率分布的單位總機率要求。
多變量情況
[編輯]兩個或多個離散隨機變量具有聯合機率密度函數,它給出了隨機變量的每個可能的實現組合的機率。
參見
[編輯]參考文獻
[編輯]- ^ Stewart, William J. Probability, Markov Chains, Queues, and Simulation: The Mathematical Basis of Performance Modeling. Princeton University Press. 2011: 105 [2022-04-18]. ISBN 978-1-4008-3281-1. (原始內容存檔於2022-04-18).
- ^ A modern introduction to probability and statistics : understanding why and how. Dekking, Michel, 1946-. London: Springer. 2005. ISBN 978-1-85233-896-1. OCLC 262680588.