狄利克雷分佈

維基百科,自由的百科全書
狄利克雷分佈
機率密度函數
A panel illustrating probability density functions of a few Dirichlet distributions over a 2-simplex, for the following α vectors (clockwise, starting from the upper left corner): (1.3, 1.3, 1.3), (3,3,3), (7,7,7), (2,6,11), (14, 9, 5), (6,2,6).
參數 分類數 (整數)
concentration parameters
值域
機率密度函數



期望值

(試看 digamma function)
眾數
變異數


其中

而且

狄利克雷分佈是一組連續多變量機率分佈,是多變量普遍化的Β分佈。為了紀念德國數學家約翰·彼得·古斯塔夫·勒熱納·狄利克雷(Peter Gustav Lejeune Dirichlet)而命名。狄利克雷分佈常作為貝葉斯統計的先驗機率。當狄利克雷分佈維度趨向無限時,這過程便稱為狄利克雷過程(Dirichlet process)。

狄利克雷分佈奠定了狄利克雷過程的基礎,被廣泛應用於自然語言處理特別是主題模型(topic model)的研究。

機率密度函數[編輯]

此圖展示了當K=3、參數αα=(0.3, 0.3, 0.3)變化到(2.0, 2.0, 2.0)時,密度函數取對數後的變化。

維度K ≥ 2的狄利克雷分佈在參數α1, ..., αK > 0上、基於歐幾里得空間RK-1里的勒貝格測度有個機率密度函數,定義為:

其中滿足,同時對於任意,都有。即在(K − 1)維的單純形開集上密度為0。

歸一化衡量B(α)是多項Β函數,可以用Γ函數(gamma function)表示:


參見[編輯]

參考[編輯]