本页使用了标题或全文手工转换

統計獨立性

维基百科,自由的百科全书
跳转至: 导航搜索

機率論裡,說兩個事件獨立的,直覺上是指一事件的發生不會影響到另一事件發生的機率。例如,骰子擲出「6」的事件和其在下一次也擲出「6」的事件是相互獨立的。類似地,兩個隨機變數是獨立的,若其在一事件給定觀測量的條件機率分佈和另一事件沒有被觀測的機率分佈是一樣的。例如,第一次擲骰子擲出的數目和第二次會出現的數目是相互獨立的。

獨立事件[编辑]

標準的定義為:

兩個事件AB獨立的若且唯若Pr(AB) = Pr(A)Pr(B)。

這裡,ABAB交集,即為AB兩個事件都會發生的事件。

更一般地,任意個事件都是互相獨立的若且唯若對其任一有限子集A1, ..., An,會有

\Pr(A_1 \cap \cdots \cap A_n)=\Pr(A_1)\,\cdots\,\Pr(A_n)

或写作:\Pr\left(\bigcap_{i=1}^n A_i\right)=\prod_{i=1}^n \Pr(A_i). \!\,

這被稱為獨立事件的乘法規則

若兩個事件AB是獨立的,則其B給之A條件機率A的「無條件機率」一樣,即

\Pr(A\mid B)=\Pr(A)\,

至少有兩個理由可以解釋為何此一敘述不可以當做獨立性的定義:(1)AB兩個事件在此敘述中並不對稱,及(2)當機率為0亦可包含於此敘述時,會有問題產生。

若回想條件機率Pr(A | B)的定義為

\Pr(A\mid B)={\Pr(A \cap B) \over \Pr(B)}, (只要Pr(B) ≠ 0 )

則上面的敘述則會等價於

\Pr(A \cap B)=\Pr(A)\Pr(B)

即為上面所給定的標準定義。

注意獨立性並不和它在地方話裡的有相同的意思。例如,一事件獨立於其自身若且唯若

\Pr(A) = \Pr(A \cap A) = \Pr(A)\Pr(A)\,

亦即,其機率不是零就是一。因此,當一事件或其補集幾乎確定會發生,它即是獨立於其本身。例如,若事件A單位區間連續型均勻分佈上選了0.5,則A是獨立於其自身的,儘管重言式地,A完全決定了A

獨立隨機變數[编辑]

上面所定義的是事件的獨立性。在這一節中,我們將處理隨機變數的獨立性。若X是一實數值隨機變數且a是一數字的話,則X ≤ a的事件是一個事件,所以可以有意義地說它是否會獨立於其他的事件。

兩個隨機變數XY是獨立的若且唯若對任何數字ab,事件[Xa](X小於或等於a的事件)和[Yb]為如上面所定義的獨立事件。類似地,隨意數量的隨機變數是明確地獨立的,若對任一有限子集X1, ..., Xn和任一數字的有限子集a1, ..., an,其事件[X1a1], ..., [Xnan]會是如上面所定義的獨立事件。

其量測可以由事件[XA]來取代上面所定義的事件[Xa],其中A為任一包絡集合。此一定義完全和上述其隨機變數的值為實數的定義等價。且他有著可以作用於複值隨機變數和在任一拓撲空間中取值之隨機變數上的優點。

即使任意數目中的任二個隨機變數都是獨立的,但它們可能仍舊會無法互相獨立;這種的獨立被稱為兩兩獨立

XY是獨立的,則其期望值E會有下列的好性質: E[X Y] = E[X] E[Y], 且其方差會有

var(X + Y) = var(X) + var(Y),

所以其協方差 cov(X,Y) 為零。(其相反,即若兩個隨機變數的協方差為0,則它們必為獨立的假設是不正確的。見無相關。)

此外,具有分佈函數FX(x) 及 FY(y)和機率密度fX(x) 及 fY(y)的隨機變數XY為獨立的,若且唯若其相結合的隨機變數(X,Y)有一共同分佈

F_{X,Y}(x,y) = F_X(x) F_Y(y),

或等價地,有一共同密度

f_{X,Y}(x,y) = f_X(x) f_Y(y).

類似的表示式亦可以用來兩個以上的隨機變數上。

條件獨立隨機變數[编辑]

直觉地,两个随机变量XY给定Z条件独立,如果:一旦知道了Z,从Y的值便不能得出任何关于X的信息。例如,相同的数量Z的两个测量XY不是独立的,但它们是给定Z条件独立(除非两个测量的误差是有关联的)。

条件独立的正式定义是基于条件分布的想法。如果XYZ离散型随机变量,那么我们定义XY给定Z条件独立,如果对于所有使\mathrm{P}(Z \le z) > 0xyz,都有:

\mathrm{P}(X \le x, Y \le y\;|\;Z = z) = \mathrm{P}(X \le x\;|\;Z = z) \cdot \mathrm{P}(Y \le y\;|\;Z = z)

另一方面,如果随机变量是连续的,且具有联合概率密度p,那么XY给定Z条件独立,如果对于所有使p_Z(z) > 0的实数xyz,都有:

p_{XY|Z}(x, y | z) = p_{X|Z}(x | z) \cdot p_{Y|Z}(y | z)

如果XY给定Z条件独立,那么对于任何满足\mathrm{P}(Z = z) > 0xyz,都有:

\ \mathrm{P}(X = x | Y = y, Z = z) = \mathrm{P}(X = x | Z = z)

也就是说,X给定YZ的条件分布,与仅仅给定Z的条件分布是相同的。对于连续的情况下的条件概率密度函数,也有一个类似的公式。

独立性可以视为条件独立的一个特例,因为概率可以视为不给定任何事件的条件概率。

另見[编辑]

書籍[编辑]

  • Kirby Faciane (2006). Statistics for Empirical and Quantitative Finance. H.C. Baird: Philadelphia. ISBN 0-9788208-9-4.