相对熵
|
|
本条目需要精通或熟悉本主题的專業人士参与及協助编辑。 |
相对熵(relative entropy)又称为KL散度(Kullback–Leibler divergence,簡稱KLD)[1],信息散度(information divergence),信息增益(information gain)。
KL散度是两个概率分布P和Q差别的非对称性的度量。 KL散度是用来 度量使用基于Q的编码来编码来自P的样本平均所需的额外的比特个数。 典型情况下,P表示数据的真实分布,Q表示数据的理论分布,模型分布,或P的近似分布。
目录 |
定義 [编辑]
對於离散隨機变量,其概率分布P 和 Q的KL散度可按下式定義為
即按概率P求得的P和Q的對數差的平均值。KL散度僅當概率P和Q各自總和均為1,且對於任何i皆滿足
及
時,才有定義。式中出現
的情況,其值按0處理。
對於連續隨機變量,其概率分佈P和Q可按積分方式定義為 [2]
其中p和q分別表示分佈P和Q的密度。
更一般的,若P和Q為集合X的概率測度,且Q關於P絕對連續,則從P到Q的KL散度定義為
其中,假定右側的表達形式存在,則
為Q關於P的R–N導數。
相應的,若P關於Q絕對連續,則
即為P關於Q的相對熵。
特性 [编辑]
相對熵的值為非負數:
由吉布斯不等式(en:Gibbs' inequality)可知,當且僅當P = Q時DKL(P||Q)為零。
尽管从直觉上KL散度是个度量或距离函数, 但是它实际上并不是一个真正的度量或距離。因為KL散度不具有对称性:从分布P到Q的距离(或度量)通常并不等于从Q到P的距离(或度量)。
KL散度和其它量的关系 [编辑]
自信息(en:self-information)和KL散度
互信息(en:Mutual information)和KL散度
信息熵(en: Shannon entropy))和KL散度
条件熵(en:conditional entropy)和KL散度
交叉熵(en:cross entropy)和KL散度
參考文獻 [编辑]
- ^ Kullback, S.; Leibler, R.A.. On Information and Sufficiency. Annals of Mathematical Statistics. 1951, 22 (1): 79–86. doi:10.1214/aoms/1177729694. MR 39968.
- ^ C. Bishop (2006). Pattern Recognition and Machine Learning. p. 55.










![\mathrm{H}(p, q) = \mathrm{E}_p[-\log q] = \mathrm{H}(p) + D_{\mathrm{KL}}(p \| q).\!](http://upload.wikimedia.org/math/d/b/c/dbc7ce8915a5c1c44f94304cc88e4563.png)