本頁使用了標題或全文手工轉換

貝葉斯定理

維基百科,自由的百科全書
跳到: 導覽搜尋

貝葉斯定理英語:Bayes' theorem)是概率論中的一個定理,它跟隨機變量條件概率以及邊緣概率分佈有關。在有些關於概率的解說中,貝葉斯定理(貝葉斯更新)能夠告知我們如何利用新證據修改已有的看法。這個名稱來自於托馬斯·貝葉斯

通常,事件A在事件B(發生)的條件下的概率,與事件B在事件A(發生)的條件下的概率是不一樣的;然而,這兩者是有確定的關係的,貝葉斯定理就是這種關係的陳述。貝葉斯公式的一個用途在於通過已知的三個概率函數推出第四個。

作為一個普遍的原理,貝葉斯定理對於所有概率的解釋是有效的;然而,頻率主義者貝葉斯主義者對於在應用中,某個隨機事件的概率該如何被賦值,有着不同的看法:頻率主義者根據隨機事件發生的頻率,或者總體樣本裏面的發生的個數來賦值概率;貝葉斯主義者則根據未知的命題來賦值概率。這樣的理念導致貝葉斯主義者有更多的機會使用貝葉斯定理。

陳述[編輯]

貝葉斯定理是關於隨機事件A和B的條件概率的一則定理。

其中P(A|B)是在B發生的情況下A發生的可能性。

在貝葉斯定理中,每個名詞都有約定俗成的名稱:

  • P(A|B)是已知B發生後A的條件概率,也由於得自B的取值而被稱作A的後驗概率
  • P(B|A)是已知A發生後B的條件概率,也由於得自A的取值而被稱作B的後驗概率
  • P(A)是A的先驗概率(或邊緣概率)。之所以稱為"先驗"是因為它不考慮任何B方面的因素。
  • P(B)是B的先驗概率或邊緣概率。

按這些術語,貝葉斯定理可表述為:

後驗概率 = (相似度*先驗概率)/標准化常量

也就是說,後驗概率與先驗概率和相似度的乘積成正比。

另外,比例P(B|A)/P(B)也有時被稱作標准相似度(standardised likelihood),貝葉斯定理可表述為:

後驗概率 = 標准相似度*先驗概率

從條件概率推導貝葉斯定理[編輯]

根據條件概率的定義。在事件B發生的條件下事件A發生的概率是[1]

同樣地,在事件A發生的條件下事件B發生的概率

整理與合併這兩個方程式,我們可以得到

這個引理有時稱作概率乘法規則。上式兩邊同除以P(B),若P(B)是非零的,我們可以得到貝葉斯定理:

二中擇一的形式[編輯]

貝葉斯定理通常可以再寫成下面的形式:

其中AC是A的補集(即非A)。故上式亦可寫成:

在更一般化的情況,假設{Ai}是事件集合裏的部份集合,對於任意的Ai,貝葉斯定理可用下式表示:

以可能性與相似率表示貝葉斯定理[編輯]

貝葉斯定理亦可由相似率Λ和可能性O表示:

其中

定義為B發生時,A發生的可能性(odds);

則是A發生的可能性。相似率(Likelihood ratio)則定義為:

貝葉斯定理與概率密度[編輯]

貝葉斯定理亦可用於連續概率分佈。由於概率密度函數嚴格上並非概率,由概率密度函數導出貝葉斯定理觀念上較為困難(詳細推導參閱[2])。貝葉斯定理與概率密度的關係是由求極限的方式建立:

全概率定理則有類似的論述:

如同離散的情況,公式中的每項均有名稱。 f(x, y)是XY的聯合分佈; fx|y)是給定Y=y後,X的後驗分佈; fy|x)= Lx|y)是Y=y後,X的相似度函數(為x的函數); fx)和fy)則是XY的邊際分佈; fx)則是X的先驗分佈。 為了方便起見,這裏的f在這些專有名詞中代表不同的函數(可以由引數的不同判斷之)。

貝葉斯定理的推廣[編輯]

對於變數有二個以上的情況,貝葉斯定理亦成立。例如:

這個式子可以由套用多次二個變數的貝式定理及條件概率的定義導出:

一般化的方法則是利用聯合概率去分解待求的條件概率,並對不加以探討的變數積分(意即對欲探討的變數計算邊緣概率)。取決於不同的分解形式,可以證明某些積分必為1,因此分解形式可被簡化。利用這個性質,貝葉斯定理的計算量可能可以大幅下降。貝葉斯網絡為此方法的一個例子,貝葉斯網絡指定數個變數的聯合概率分佈的分解型式,該概率分佈滿足下述條件:當其他變數的條件概率給定時,該變數的條件概率為一簡單型式。

範例[編輯]

吸毒者檢測[編輯]

下面展示貝葉斯定理在檢測吸毒者時的應用。假設一個常規的檢測結果的敏感度與可靠度均為99%,即吸毒者每次檢測呈陽性(+)的概率為99%。而不吸毒者每次檢測呈陰性(-)的概率為99%。從檢測結果的概率來看,檢測結果是比較準確的,但是貝葉斯定理卻可以揭示一個潛在的問題。假設某公司對全體僱員進行吸毒檢測,已知0.5%的僱員吸毒。請問每位檢測結果呈陽性的僱員吸毒的概率有多高?

令「D」為僱員吸毒事件,「N」為僱員不吸毒事件,「+」為檢測呈陽性事件。可得

  • P(D)代表僱員吸毒的概率,不考慮其他情況,該值為0.005。因為公司的預先統計表明該公司的僱員中有0.5%的人吸食毒品,所以這個值就是D的先驗概率
  • P(N)代表僱員不吸毒的概率,顯然,該值為0.995,也就是1-P(D)。
  • P(+|D)代表吸毒者陽性檢出率,這是一個條件概率,由於陽性檢測準確性是99%,因此該值為0.99。
  • P(+|N)代表不吸毒者陽性檢出率,也就是出錯檢測的概率,該值為0.01,因為對於不吸毒者,其檢測為陰性的概率為99%,因此,其被誤檢測成陽性的概率為1 - 0.99 = 0.01。
  • P(+)代表不考慮其他因素的影響的陽性檢出率。該值為0.0149或者1.49%。我們可以通過全概率公式計算得到:此概率 = 吸毒者陽性檢出率(0.5% x 99% = 0.495%)+ 不吸毒者陽性檢出率(99.5% x 1% = 0.995%)。P(+)=0.0149是檢測呈陽性的先驗概率。用數學公式描述為:

根據上述描述,我們可以計算某人檢測呈陽性時確實吸毒的條件概率P(D|+):

儘管吸毒檢測的準確率高達99%,但貝葉斯定理告訴我們:如果某人檢測呈陽性,其吸毒的概率只有大約33%,不吸毒的可能性比較大。假陽性高,則檢測的結果不可靠。

胰腺癌檢測[編輯]

基於貝葉斯定理:即使100%的胰腺癌症患者都有某症狀,而某人有同樣的症狀,絕對不代表該人有100%的概率得胰腺癌,還需要考慮先驗概率,假設胰腺癌的發病率是十萬分之一,而全球有同樣症狀的人有萬分之一,則此人得胰腺癌的概率只有十分之一,90%的可能是是假陽性。

恐怖分子檢測[編輯]

基於貝葉斯定理:假設100%的恐怖分子都相信A宗教,而某人相信A宗教,並不代表此人100%是恐怖分子,還需要考慮先驗概率,假設全球有6萬恐怖分子,在人類中的概率是十萬分之一(假設人類有60億人),假設全球有1/3的人口相信A宗教(20億人信A宗教),則此人是恐怖分子的概率只有十萬分之三。

參見[編輯]

參考文獻[編輯]

  1. ^ Kenneth H. Rosen. Discrete Mathematics and its Applications 7th edition. 2012: 456. ISBN 978-0-07-338309-5 (英語). 
  2. ^ Papoulis A.(1984). Probability, Random Variables, and Stochastic Processes, 2nd edition. Section 7.3. New York: McGraw-Hill.

外部連結[編輯]