概率模型

維基百科,自由的百科全書
跳至導覽 跳至搜尋

概率模型Statistical Model,也稱為Probabilistic Model)是用來描述不同隨機變量之間關係的數學模型,通常情況下刻畫了一個或多個隨機變量之間的相互非確定性概率關係。從數學上講,該模型通常被表達為,其中是觀測集合用來描述可能的觀測結果,對應的概率分布函數集合。若使用概率模型,一般而言需假設存在一個確定的分布生成觀測數據。因此通常使用統計推斷的辦法確定集合中誰是數據產生的原因。

大多數統計檢驗都可以被理解為一種概率模型。例如,一個比較兩組數據均值的學生t檢驗可以被認為是對該概率模型參數是否為0的檢測。此外,檢驗與模型的另一個共同點則是兩者都需要提出假設並且誤差在模型中常被假設為正態分布。

定義[編輯]

概率模型是一個概率分布函數密度函數的集合。可分為參數模型,無參數和半參數模型。

參數模型是一組由有限維參數構成的分布集合。其中是參數,而是其可行歐幾里得子空間。概率模型可被用來描述一組可產生已知採樣數據的分布集合。例如,假設數據產生於唯一參數的高斯分布,則我們可假設該概率模型為

無參數模型則是一組由無限維參數構成的概率分布函數集合,可被表示為

相比於無參數模型和參數模型,半參數模型也由無限維參數構成,但其在分布函數空間內並不緊密。例如,一組混疊的高斯模型。確切的說,如果是參數的維度,是數據點的大小,如果隨着,則我們稱之為半參數模型。