本页使用了标题或全文手工转换

贝叶斯定理

维基百科,自由的百科全书
跳转至: 导航搜索

贝叶斯定理英语:Bayes' theorem)是概率论中的一个定理,它跟随机变量条件概率以及边缘概率分布有关。在有些关于概率的解说中,贝叶斯定理(贝叶斯更新)能够告知我们如何利用新证据修改已有的看法。這個名稱來自於托马斯·贝叶斯

通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定理就是这种关系的陈述。贝叶斯公式的用途在于通过己知三个概率函数推出第四个。它的内容是:在B出现的前提下,A出现的概率等于A和B都出现的概率乘以A出现的概率再除以B出现的概率。通过联系A与B,计算从一个事件产生另一事件的概率,即从结果上溯原。

作为一个普遍的原理,贝叶斯定理对于所有概率的解释是有效的;然而,频率主义者贝叶斯主义者对于在应用中,某个随机事件的概率该如何被赋值,有着不同的看法:频率主义者根据随机事件发生的频率,或者总体样本裡面的发生的个数来赋值概率;贝叶斯主义者则根据未知的命题来赋值概率。这样的理念导致贝叶斯主义者有更多的机会使用贝叶斯定理。

陈述[编辑]

贝叶斯定理是关于随机事件A和B的条件概率的一則定理。

其中P(A|B)是在B发生的情况下A发生的可能性。

在贝叶斯定理中,每个名词都有约定俗成的名称:

  • P(A|B)是已知B發生后A的條件概率,也由于得自B的取值而被稱作A的后驗概率
  • P(B|A)是已知A發生后B的條件概率,也由于得自A的取值而被稱作B的后驗概率
  • P(A)是A的先驗概率或(或边缘概率)。之所以稱為"先驗"是因為它不考慮任何B方面的因素。
  • P(B)是B的先驗概率或邊緣概率。

按這些術語,贝叶斯定理可表述為:

后驗概率 = (相似度*先驗概率)/標准化常量

也就是說,后驗概率与先驗概率和相似度的乘積成正比。

另外,比例P(B|A)/P(B)也有時被稱作標准相似度(standardised likelihood),贝叶斯定理可表述為:

后驗概率 = 標准相似度*先驗概率

從條件概率推導貝氏定理[编辑]

根據條件概率的定義。在事件B发生的条件下事件A发生的概率是[1]

同樣地,在事件A发生的条件下事件B发生的概率

整理与合并這兩個方程式,我們可以找\到

这个引理有时称作概率乘法规则。上式兩邊同除以P(A),若P(A)是非零的,我們可以得到贝叶斯 定理:

二中擇一的形式[编辑]

貝氏定理通常可以再寫成下面的形式:

其中AC是A的補集(即非A)。故上式亦可寫成:

在更一般化的情況,假設{Ai}是事件集合裡的部份集合,對於任意的Ai,貝氏定理可用下式表示:

以可能性與相似率表示貝氏定理[编辑]

貝氏定理亦可由相似率Λ和可能性O表示:

其中

定義為B發生時,A發生的可能性(odds);

則是A發生的可能性。相似率(Likelihood ratio)則定義為:

貝氏定理與概率密度[编辑]

貝氏定理亦可用於連續機率分佈。由於機率密度函數嚴格上並非機率,由機率密度函數導出貝氏定理觀念上較為困難(詳細推導參閱[2])。貝氏定理與機率密度的關係是由求極限的方式建立:

全機率定理則有類似的論述:

如同離散的情況,公式中的每項均有名稱。 f(x, y)是XY的聯合分佈; fx|y)是給定Y=y後,X的後驗分佈; fy|x)= Lx|y)是Y=y後,X的相似度函數(為x的函數); fx)和fy)則是XY的邊際分佈; fx)則是X的先驗分佈。 為了方便起見,這裡的f在這些專有名詞中代表不同的函數(可以由引數的不同判斷之)。

貝氏定理的推廣[编辑]

對於變數有二個以上的情況,貝氏定理亦成立。例如:

這個式子可以由套用多次二個變數的貝式定理及條件機率的定義導出:

一般化的方法則是利用聯合機率去分解待求的條件機率,並對不加以探討的變數積分(意即對欲探討的變數計算邊緣機率)。取決於不同的分解形式,可以證明某些積分必為1,因此分解形式可被簡化。利用這個性質,貝氏定理的計算量可能可以大幅下降。貝氏網路為此方法的一個例子,貝氏網路指定數個變數的聯合機率分佈的分解型式,該機率分佈滿足下述條件:當其他變數的條件機率給定時,該變數的條件機率為一簡單型式。

範例[编辑]

吸毒者检测[编辑]

下面展示贝叶斯定理在检测吸毒者时的应用。假设一个常规的检测结果的敏感度与可靠度均为99%,即吸毒者每次检测呈阳性(+)的概率为99%。而不吸毒者每次检测呈阴性(-)的概率为99%。从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理卻可以揭示一个潜在的问题。假设某公司对全体雇员进行吸毒检测,已知0.5%的雇员吸毒。请问每位检测结果呈阳性的雇员吸毒的概率有多高?

令“D”为雇员吸毒事件,“N”为雇员不吸毒事件,“+”为检测呈阳性事件。可得

  • P(D)代表雇员吸毒的概率,不考虑其他情况,该值为0.005。因为公司的预先统计表明该公司的雇员中有0.5%的人吸食毒品,所以这个值就是D的先验概率
  • P(N)代表雇员不吸毒的概率,显然,该值为0.995,也就是1-P(D)。
  • P(+|D)代表吸毒者阳性检出率,这是一个条件概率,由于阳性检测准确性是99%,因此该值为0.99。
  • P(+|N)代表不吸毒者阳性检出率,也就是出错检测的概率,该值为0.01,因为对于不吸毒者,其检测为阴性的概率为99%,因此,其被误检测成阳性的概率为1 - 0.99 = 0.01。
  • P(+)代表不考虑其他因素的影响的阳性检出率。该值为0.0149或者1.49%。我们可以通过全概率公式计算得到:此概率 = 吸毒者阳性检出率(0.5% x 99% = 0.495%)+ 不吸毒者阳性检出率(99.5% x 1% = 0.995%)。P(+)=0.0149是检测呈阳性的先验概率。用数学公式描述为:

根据上述描述,我们可以计算某人检测呈阳性时确实吸毒的条件概率P(D|+):

尽管吸毒检测的准确率高达99%,但贝叶斯定理告诉我们:如果某人检测呈阳性,其吸毒的概率只有大约33%,不吸毒的可能性比较大。假阳性高,则检测的结果不可靠。

胰腺癌检测[编辑]

基于贝叶斯定理:即使100%的胰腺癌症患者都有某症状,而某人有同样的症状,绝对不代表该人有100%的概率得胰腺癌,还需要考虑先验概率,假设胰腺癌的发病率是十万分之一,而全球有同样症状的人有万分之一,则此人得胰腺癌的概率只有十分之一,90%的可能是是假阳性。

恐怖分子检测[编辑]

基于贝叶斯定理:假设100%的恐怖分子都相信某宗教,而某人相信某宗教,并不代表此人100%是恐怖分子,还需要考虑先验概率,假设全球有6万恐怖分子,在人类中的概率是十万分之一,假设全球有1/3的人口相信某宗教,则此人是恐怖分子的概率只有十万分之三。

参见[编辑]

參考文獻[编辑]

  1. ^ Kenneth H. Rosen. Discrete Mathematics and its Applications 7th edition. 2012: 456. ISBN 978-0-07-338309-5 (英文). 
  2. ^ Papoulis A.(1984). Probability, Random Variables, and Stochastic Processes, 2nd edition. Section 7.3. New York: McGraw-Hill.

外部連結[编辑]