機率論

維基百科,自由的百科全書
前往: 導覽搜尋
典型的機率問題:「擲一顆公正的骰子,出現3點的機率是多少?」

機率論是研究隨機性或不確定性等現象的數學。更精確地說,機率論是用來模擬實驗在同一環境下會產生不同結果的情況。典型的隨機實驗有擲骰子、扔硬幣、抽撲克牌以及輪盤遊戲等。

數學家和精算師認為機率是在0至1閉區間內的數字,指定給一發生與失敗是隨機的「事件」。機率P(A)根據機率公理來指定給事件A

一事件A在一事件B確定發生後會發生的機率稱為B給之A條件機率;其數值為{P(B \cap A) \over P(A)}(當P(A)不等於零時)。若B給之A的條件機率和A的機率相同時,則稱AB獨立事件。且AB的此一關係為對稱的,這可以由一同價敘述:「P(A \cap B) = P(A)P(B),當AB為獨立事件時。」中看出。

機率論中的兩個重要概念為隨機變數和隨機變數的機率分佈這兩種概念;更多訊息,可參見其條目。

生活例子[編輯]

人們對機率總是有一點觸摸不清的感覺,而事實上也有很多看似奇異的結果:

  • 1; 六合彩:在六合彩(49選6)中,一共有13,983,816種可能性(參閱組合數學),

如果每周都買一組不相同的號,一年有52周,則在實驗越多次(一直買直到中獎算一次)之後,平均中獎所花的時間會越接近\frac{13983816}{52}=268919。 事實上,即使每周買相同的號,獲得頭獎的機率也是相同的。 但假設每周實際中獎的組合都不重複,268919年的算術推論是正確的,這說明機率和其他數學理論可能導出不同的結論。

  • 2; 六合彩:仍然是六合彩。買5, 17, 19, 24, 33, 49中奬機率高還是買1,2,3,4,5,6的中奬機率高?

古典機率論說:一樣。
但實際上機械綵球製造上都有些小的差異,所以每組機率不一定完全相同,但必須累積多期開獎結果後才看得出來。

  • 3; 生日悖論:在一個足球場上有23個人(2×11個運動員和1個裁判員),

不可思議的是,在這23人當中至少有兩個人的生日是在同一天的機率要大於50%。 如果這23人都沒有相同的生日也不違反機率,只是小於50%。

  • 4; 輪盤遊戲:在遊戲中玩家可能認為,在連續出現多次紅色後,出現黑色的機率會越來越大。

這種判斷也是錯誤的,即出現黑色的機率每次是相等的,因為球本身並沒有「記憶」, 它不會意識到以前都發生了什麼,其機率始終是\frac{18}{37}
但輪盤的前後期開獎數字形成時間序列(可能存在自迴歸模型)。

  • 5; 贏取電視節目裡的名車:在參賽者面前有三扇關閉的門,其中只有一扇後面有名車,而其餘的後面是山羊。

遊戲規則是,參賽者先選取一扇門,但在他打開之前,主持人在其餘兩扇門中打開了一扇有山羊的門, 並詢問參賽者是否改變主意選擇另一扇門,以使贏得名車的機率變大。

正確的分析結果是,假如不管開始哪一扇門被選,主持人都打開其餘兩扇門中有山羊的那一扇並詢問參賽者是否改變主意, 則改變主意會使贏得汽車的機率增加一倍;(「標準」的三門問題情況。)


假如主持人只在有名車那扇門被選中時勸誘參賽者打開其它門,則改變主意必輸。(資訊不對稱)

歷史[編輯]

作為數學統計基礎的機率論的創始人分別是法國數學家帕斯卡費馬,其可追溯到公元17世紀。當時的法國宮廷貴族裡盛行著擲骰子遊戲,遊戲規則是玩家連續擲4次骰子,如果其中沒有6點出現,玩家贏,如果出現一次6點,則莊家(相當於現在的賭場)贏。按照這一遊戲規則,從長期來看,莊家扮演贏家的角色,而玩家大部分時間是輸家,因為莊家總是要靠此為生的,因此當時人們也就接受了這種現象。

後來為了使遊戲更刺激,遊戲規則發生了些許變化,玩家這回用2個骰子連續擲24次,不同時出現2個6點,玩家贏,否則莊家贏。當時人們普遍認為,2次出現6點的機率是一次出現6點的機率的1 / 6,因此6倍於前一種規則的次數,也既是24次贏或輸的機率與以前是相等的。然而事實卻並非如此,從長期來看,這回莊家處於輸家的狀態,於是他們去請教當時的數學家帕斯卡,求助其對這種現象作出解釋。

其他對機率論的發展作出重要貢獻的人還有荷蘭物理、數學家惠更斯,瑞士物理、數學家伯努利,法國數學家棣莫弗,法國數學、天文學家拉普拉斯,德國數學家高斯,法國物理、數學家泊松,義大利數學、醫學家卡爾達諾以及蘇聯數學家柯爾莫哥洛夫

事件[編輯]

單位事件、事件空間、隨機事件[編輯]

在一次隨機試驗中可能發生的不能再細分的結果被稱為基本事件,或者稱為單位事件,用 E 表示。在隨機試驗中可能發生的所有單位事件的集合稱為事件空間,用 S 來表示。例如在一次擲骰子的隨機試驗中,如果用獲得的點數來表示單位事件,那麼一共可能出現 6 個單位事件,則事件空間可以表示為 S = \{ 1,2,3,4,5,6 \}

上面的事件空間是由可數有限單位事件組成,事實上還存在著由可數無限以及不可數單位事件組成的事件空間,比如在一次獲得正面朝上就停止的隨機擲硬幣試驗中,其事件空間由可數無限單位事件組成,表示為:S={ 正,反正,反反正,反反反正,反反反反正,···},注意到在這個例子中"反反反正"是單位事件。將兩根筷子隨意扔向桌面,其靜止後所形成的交角假設為 \alpha,這個隨機試驗的事件空間的組成可以表示為 S= \{ \alpha | 0^\circ \le \alpha < 180^\circ \}

隨機事件是事件空間 S 的子集,它由事件空間 S 中的單位元素構成,用大寫字母 A,B,C\cdots 表示。例如在擲兩個骰子的隨機試驗中,設隨機事件 A = 「獲得的點數和大於10」,則 A 可以由下面 3 個單位事件組成:A = \{ ( 5,6 ),( 6,5 ),( 6,6 ) \}

如果在隨機試驗中事件空間中的所有可能的單位事件都發生,這個事件被稱為 必然事件,表示為 S \subset S ;相應的如果事件空間里不包含任何一個單位事件,則稱為不可能事件,表示為 \varnothing \subset S

事件的計算[編輯]

因為事件在一定程度上是以集合的含義定義的,因此可以把集合計算方法直接應用於事件的計算,也就是說,在計算過程中,可以把事件當作集合來對待。

Komplement3.png
A 的補集
不屬於 A 的事件發生
Vereinigung.png
並集 AB
或者A 或者 B 或者 A, B 同時發生
Durchschnitt.png
交集 AB
事件 A,B 同時發生
Differenz.png
差集 A \ B
不屬於 BA 事件發生
Disjunkte.png
空集 AB = ∅
A,B 事件不同時發生
Impliziert.png
子集 BA
B 發生,則 A 也一定發生

在輪盤遊戲中假設 A 代表事件「球落在紅色區域」,B 代表事件"球落在黑色區域",因為事件 AB 沒有共同的單位事件,因此可表示為

A\cap B=\varnothing

注意到事件 AB 並不是互補的關係,因為在整個事件空間 S 中還有一個單位事件「零」,其即不是紅色也不是黑色,而是綠色,因此 A,B 的補集應該分別表示如下:

\bar{A}=S\setminus A=B\cup \left \{ 0 \right \}
\bar{B}=S\setminus B=A\cup \left \{ 0 \right \}

機率的定義[編輯]

傳統機率 (古典機率)( 拉普拉斯機率 )[編輯]

傳統機率的定義是由法國數學家拉普拉斯 ( Laplace ) 提出的。如果一個隨機試驗所包含的單位事件是有限的,且每個單位事件發生的可能性均相等,則這個隨機試驗叫做拉普拉斯試驗。在拉普拉斯試驗中,事件 A 在事件空間 S 中的機率 P(A) 為:

Begriff.png

例如,在一次同時擲一個硬幣和一個骰子的隨機試驗中,假設事件 A 為獲得國徽面且點數大於 4 ,那麼事件 A 的機率應該有如下計算方法:S= { ( 國徽,1 點 ),( 數字,1 點 ),( 國徽,2 點 ),( 數字,2 點 ),( 國徽,3 點 ),( 數字,3 點 ),( 國徽,4 點 ),( 數字,4 點 ),( 國徽,5 點 ),( 數字,5 點 ),( 國徽,6 點 ),( 數字,6 點 ) },A={( 國徽,5 點 ),( 國徽,6 點 )},按照拉普拉斯定義,A 的機率為,

P(A)=\frac{2}{12}=\frac{1}{6}

注意到在拉普拉斯試驗中存在著若干的疑問,在現實中是否存在著其單位事件的機率具有精確相同的機率值的試驗? 因為我們不知道,硬幣以及骰子是否完美,即骰子製造的是否均勻,其重心是否位於正中心,以及輪盤是否傾向於某一個數字。 儘管如此,傳統機率在實踐中被廣泛應用於確定事件的機率值,其理論根據是: 如果沒有足夠的論據來證明一個事件的機率大於另一個事件的機率,那麼可以認為這兩個事件的機率值相等

如果仔細觀察這個定義會發現拉普拉斯用機率解釋了機率,定義中用了相同的可能性 ( 原文是 également possible )一詞,其實指的就是"相同的機率"。這個定義也並沒有說出,到底什麼是機率,以及如何用數字來確定機率。在現實生活中也有一系列問題,無論如何不能用傳統機率定義來解釋,比如,人壽保險公司無法確定一個 50 歲的人在下一年將死去的機率。

統計機率[編輯]

繼傳統機率論之後,英國邏輯學約翰·維恩和奧地利數學家理察提出建立在頻率理論基礎上的統計機率。他們認為,獲得一個事件的機率值的唯一方法是通過對該事件進行 100 次,1000 次或者甚至 10000 次的前後相互獨立的 n 次隨機試驗,針對每次試驗均記錄下絕對頻率值和相對頻率h_n (A),隨著試驗次數 n 的增加,會出現如下事實,即相對頻率值會趨於穩定,它在一個特定的值上下浮動,也即是說存在著一個極限值 P(A),相對頻率值趨向於這個極限值。這個極限值被稱為統計機率,表示為:

P(A)=\lim_{n \to \infty}h_n (A)

例如,若想知道在一次擲骰子的隨機試驗中獲得 6 點的機率值可以對其進行 3000 次前後獨立的扔擲試驗,在每一次試驗後記錄下出現 6 點的次數,然後通過計算相對頻率值可以得到趨向於某一個數的統計機率值。

扔擲數 獲得 6 點的絕對頻率 獲得 6 點的相對頻率
1 1 1.00000
2 1 0.50000
3 1 0.33333
4 1 0.25000
5 2 0.40000
10 2 0.20000
20 5 0.25000
100 12 0.12000
200 39 0.19500
300 46 0.15333
400 72 0.18000
500 76 0.15200
600 102 0.17000
700 120 0.17143
1000 170 0.17000
2000 343 0.17150
3000 560 0.16867

上面提到的這個有關相對頻率的經驗規律是大數定律在現實生活中的反映,大數定律是初等機率論的基礎。統計機率在今天的實踐中依然具有重要意義,特別是在初等機率論及數理統計等學科中。

現代機率論[編輯]

與初等機率論相對的,是「現代機率論」。因「測度論」的研究與發展,機率論得以建立公理化系統。 一些曾經無法用初等機率論解釋的概念因此得以用公理化的語言進行解釋。 可以說現代機率論以測度論為理論基礎終於得以完善,完成了其現代化進程。

機率公理[編輯]

如果一個函數P:S\to \R, \ A\mapsto P(A)指定給每一個事件空間 S 中的事件 A 一個實數 P(A),並且其滿足下面的 3 個公理,那麼函數 P 叫做機率函數,相應的 P(A) 叫做事件 A 的機率。

公理 1: 0\le P(A) \le 1 \ (A \in S)
事件 A 的機率 P(A) 是一個0與1之間(包含0與1)的非負實數。
公理 2: P(S)=1
事件空間的機率值為 1 。
公理 3: P(A\cup B)=P(A)+P(B),如果 A\cap B=\varnothing
互斥事件的加法法則。這裡需注意:公理3可以推廣到可數個互斥事件的聯集

機率的計算[編輯]

需要提及的是下面將要介紹的 9 個計算機率的定理與上面已經提及的事件的計算沒有關係,所有關於機率的定理均由機率的 3 個公理得來,同時適用於包括拉普拉斯機率和統計機率在內的所有機率理論。

定理 1 (互補法則)[編輯]

A 互補事件的機率始終是

P(\bar{A})=1-P(A), \in S
Komplement3.png

證明:
事件 A\overline {A} 是互補關係,由公理 3 和公理 2 可得

P(A)+P(\bar{A})=P(S)=1
\Rightarrow P(\bar{A})=1-P(A)


利用互補法則,可以解決下面這個問題,在兩次連續旋轉的輪盤遊戲中,至少有一次是紅色的機率是多少?
第一次旋轉紅色不出現的機率是 19/37 ,按照乘法法則,第二次也不出現紅色的機率是 (19/37)2 = 0.2637,因此在這裡互補機率就是指在兩次連續旋轉中至少有一次是紅色的機率,
 P   = 1 -  \left( \frac{19}{37} \right)^2 = 0.7363

定理 2[編輯]

不可能事件的機率為零:

P(\varnothing)=0

證明:

\varnothingS 是互補事件,按照公理 2 有

P(S)=1,再根據上面的定理 1 得到
P(\varnothing)=1-1=0

注意:此定理的逆命題不成立,即機率為零的事件不一定是不可能事件。

例子:按照歐幾里得幾何的定義和幾何概型的計算公式,飛鏢飛中靶中一點或一條線的機率為零(點、線的面積為零),但是這不是不可能事件。

同理機率為1的事件不一定是必然事件。

定理 3[編輯]

如果若干事件 A_1,A_2,\cdots A_n \in S 每兩兩之間是空集關係,那麼這些所有事件集合的機率等於單個事件的機率的和。

P(A_1\cup \cdots \cup A_n)=\sum_{j=1}^n P(A_j)

注意針對這一定理有效性的決定因素是 A_1 \cdots A_n 事件不能同時發生。例如,在一次擲骰子中,得到 5 點或者 6 點的機率是:

P=P(A_5)+P(A_6)=Wuerfel.png = \frac{2}{6} = \frac{1}{3}

定理 4[編輯]

如果事件 AB 是差集關係,則有,

P(A\setminus B)=P(A)-P(A\cap B)
Theorem4.png

證明:

事件 A 由下面兩個事件組成:

A\setminus BA\cap B
由公理 3 得,
P(A)=P(A\setminus B)+P(A\cap B)

定理 5 (任意事件加法法則)[編輯]

對於事件空間 S 中的任意兩個事件 AB,有如下定理:

P(A \cup B) = P(A) + P(B)  - P(A \cap B)

證明:

事件 A \cup B 由下面三個事件組成:
A\cup B=(A \setminus B)\cup (A\cap B)\cup (B \setminus A)
首先根據定理 4 有:

\begin{array}{lcr}
P(A\setminus B) & = & P(A)-P(A\cap B)\\
P(B\setminus A) & = & P(B)-P(A\cap B)
\end{array}

再根據定理 3 得:


\begin{align}
P(A\cup B) & =P(A\setminus B)+P(A\cap B)+P(B\setminus A)\\
& =P(A)-P(A\cap B)+P(A\cap B)+P(B)-P(A\cap B)\\
& =P(A)+P(B)-P(A\cap B)
\end{align}

例如,在由一共 32 張牌構成的斯卡特撲克牌中隨機抽出一張,其或者是"方片"或者是"\mathcal{A}"的機率是多少?

事件 AB 是或者的關係,且可同時發生,就是說抽出的這張牌即可以是"方片",又可以是"\mathcal{A}",AB ( 既發生 A 又發生 B ) 的值是 1 / 32,( 從示意圖上也可以看出,即是方片又是\mathcal{A}只有一張,即機率是 1 / 32 ),因此有如下結果:
P(A \cup B) = \frac{8}{32} + \frac{4}{32} - \frac{1}{32} = \frac{11}{32}

注意到公理 3 是定理 5 的特殊情況,即 AB 不同時發生,相應的 P(A∩B)=0。

定理 6 (乘法法則)[編輯]

輪盤遊戲示意圖 2

事件 AB 同時發生的機率是:

P(A \cap B) = P(A) \cdot P(B \vert A) = P(B) \cdot P(A \vert B)

公式中的 P ( A | B ) 是指在 B 條件下 A 發生的機率,又稱作條件機率。回到上面的斯卡特遊戲中,在 32 張牌中隨機抽出一張,即是方片又是\mathcal{A}的機率是多少呢?現用 P(A) 代表抽出方片的機率,用 P(B) 代表抽出\mathcal{A}的機率,很明顯,AB 之間有一定聯繫,即 A 里包含有 BB 里又包含有 A,在 A 的條件下發生 B 的機率是 P(B | A)=1/8,則有:

P(A \cap B) = P(A) \cdot P(B \vert A) = \frac{8}{32} \cdot\frac{1}{8}=\frac{1}{32}

或者,P(A \cap B) = P(B) \cdot P(A \vert B) = \frac{4}{32} \cdot\frac{1}{4}=\frac{1}{32}
從上面的圖中也可以看出,符合條件的只有一張牌,即方片\mathcal{A}

另一個例子,在 32 張斯卡特牌里連續抽兩張 ( 第一次抽出的牌不放回去 ),連續得到兩個\mathcal{A}的機率是多少呢?
AB 分別為連續發生的這兩次事件,我們看到,AB 之間有一定聯繫,即 B 的機率由於 A 發生了變化,屬於條件機率,按照公式有:P(A \cap B) = P(A) \cdot P(B \vert A) = \frac{4}{32} \cdot\frac{3}{31}=\frac{3}{248}

定理 7 (無關事件乘法法則)[編輯]

兩個不相關聯的事件 AB 同時發生的機率是:

P(A \cap B) = P (A)\cdot P(B)

注意到這個定理實際上是定理 6 (乘法法則) 的特殊情況,如果事件 AB 沒有聯繫,則有 P(A|B)=P(A),以及 P(B|A)=P(B)。現在觀察一下輪盤遊戲中兩次連續的旋轉過程,P ( A ) 代表第一次出現紅色的機率,P ( B ) 代表第二次出現紅色的機率,可以看出,AB 沒有關聯,利用上面提到的公式,連續兩次出現紅色的機率為:

P(A \cap B) = \frac{18}{37} \cdot \frac{18}{37}  = 0.2367

忽視這一定理是造成許多玩家失敗的根源,普遍認為,經過連續出現若干次紅色後,黑色出現的機率會越來越大,事實上兩種顏色每次出現的機率是相等的,之前出現的紅色與之後出現的黑色之間沒有任何聯繫,因為球本身並沒有"記憶",它並不"知道"以前都發生了什麼。同理,連續 10 次出現紅色的機率為 P=(18/37)10 =0.0007

完全機率[編輯]

n 個事件 H_1,H_2,...H_n 互相間獨立,且共同組成整個事件空間 S,即
H_i\cap H_j=\varnothing( i\neq j ) 以及
H_1\cup H_2\cup ...\cup H_n=S
這時 A 的機率可以表示為,

P(A)=\sum_{j=1}^n P(A|H_j)\cdot P(H_j)

證明:

A=(A\cap H_1)\cup (A\cap H_2)\cup \ldots \cup (A\cap H_n)
按照公理 3 ,有
P(A)=P(A\cap H_1)+P(A\cap H_2)+\ldots +P(A\cap H_n)
根據乘法法則,P( A\cap H_j)=P( A | H_j)\cdot P( H_j)
因此有,
P( A )=P( A | H_1) \cdot P( H_1)+\ldots +P( A | H_n) \cdot P( H_n)
P(A)=\sum_{j=1}^n P(A|H_j)\cdot P(H_j)

例如,一個隨機試驗工具由一個骰子和一個柜子中的三個抽屜組成,抽屜 1 里有 14 個白球和 6 個黑球,抽屜 2 里有 2 個白球和 8 個黑球,抽屜 3 里有 3 個白球和 7 個黑球,試驗規則是首先擲骰子,如果獲得小於 4 點,則抽屜 1 被選擇,如果獲得 4 點或者 5 點,則抽屜 2 被選擇,其他情況選擇抽屜 3 。然後在選擇的抽屜里隨機抽出一個球,最後抽出的這個球是白球的機率是:

P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)

=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)
=28/60=0.4667

從例子中可看出,完全機率特別適合於分析具有多層結構的隨機試驗的情況。

貝葉斯定理[編輯]

貝葉斯定理由英國數學家托馬斯·貝葉斯 ( Thomas Bayes 1702-1761 ) 發展,用來描述兩個條件機率之間的關係,比如 P(A|B) 和 P(B|A)。按照定理 6 的乘法法則,P(A∩B)=P(A)·P(B|A)=P(B)·P(A|B),可以立刻導出貝葉斯定理:

P(A \vert B) = \frac {P(B \vert A) \cdot P(A)} {P(B)}


例如:一座別墅在過去的 20 年裡一共發生過 2 次被盜,別墅的主人有一條狗,狗平均每周晚上叫 3 次,在盜賊入侵時狗叫的機率被估計為 0.9,問題是:在狗叫的時候發生入侵的機率是多少?
我們假設 A 事件為狗在晚上叫,B 為盜賊入侵,則 P( A )=3/7 P( B )=2/(20·365.25)=2/7305,P(A | B) = 0.9,按照公式很容易得出結果:
P(B \vert A) = 0.9 \cdot \frac{2}{7305}\cdot\frac{7}{3}=0.0005749486653...

另一個例子,現分別有 AB 兩個容器,在容器 A 里分別有 7 個紅球和 3 個白球,在容器 B 里有 1 個紅球和 9 個白球,現已知從這兩個容器里任意抽出了一個球,且是紅球,問這個紅球是來自容器 A 的機率是多少?

假設已經抽出紅球為事件 B,從容器 A 里抽出球為事件 A,則有:P ( B ) = 8 / 20,P ( A ) = 1 / 2,P ( B | A ) = 7 / 10,按照公式,則有:
P(A \vert B) = \frac{7}{10}\cdot\frac{1}{2}\cdot\frac{20}{8}=\frac{7}{8}

機率分布[編輯]

機率論的應用[編輯]

雖然機率論最早產生於17世紀,然而其公理體系只在20世紀的20至30年代才建立起來並得到迅速發展,在過去的半個世紀里機率論在越來越多的新興領域顯示了它的應用性和實用性,例如:物理化學生物醫學心理學社會學政治學教育學經濟學以及幾乎所有的工程學等領域。特別值得一提的是,機率論是今天數理統計的基礎,其結果被用做問卷調查的分析資料或者對經濟前景進行預測。

參見[編輯]

參考文獻[編輯]

  1. (德文) 彼得 缺菲爾 ( Peter Zoefel ):《統計和經濟學家》 PEASON Studium 出版社 2003 年 ISBN 3-8273-7062-0
  2. (德文) 約瑟夫 西拉 ( Josef Schira ):《統計理論與企業管理》 PEASON Studium 出版社 2003 年 ISBN 3-8273-7041-8
  3. (德文) 漢斯-底特 黑伯曼 ( Hans-Dieter Hippmann ):《統計學》 SCHAEFFER POESCHEL 出版社 2003 年 ISBN 3-7910-2119-2
  4. (德文) 里波舒爾茨 ( Seymour Lipschutz ):《機率計算-理論和應用》 McGRAW-HILL BOOK COMPANY GmbH 出版社 1980 年 ISBN 0-07-084361-9
  5. (德文) 貝爾等 ( Beyer,Hackel,Pieper,Tiedge )《機率計算和數學統計》 Harri Deutsch 出版社 1980 年 ISBN 3-87144-433-2