信賴區間

維基百科,自由的百科全書
跳轉到: 導覽搜尋

統計學中,一個機率樣本信賴區間(Confidence interval)是對這個樣本的某個總體參數區間估計。信賴區間展現的是這個參數的真實值有一定機率落在測量結果的周圍的程度。信賴區間給出的是被測量參數的測量值的可信程度,即前面所要求的「一定機率」。這個機率被稱為信心水準。舉例來說,如果在一次大選中某人的支持率為55%,而信心水準0.95上的信賴區間是(50%,60%),那麼他的真實支持率有百分之九十五的機率落在百分之五十和百分之六十之間,因此他的真實支持率不足一半的可能性小於百分之2.5(假設分布是對稱的)。

如例子中一樣,信心水準一般用百分比表示,因此信心水準0.95上的信賴區間也可以表達為:95%信賴區間。信賴區間的兩端被稱為置信極限。對一個給定情形的估計來說,信心水準越高,所對應的信賴區間就會越大。

對信賴區間的計算通常要求對估計過程的假設(因此屬於參數統計),比如說假設估計的誤差是成常態分佈的。

信賴區間只在頻率統計中使用。在貝葉斯統計中的對應概念是可信區間。但是可信區間和信賴區間是建立在不同的概念基礎上的,因此一般上說取值不會一樣。 置信空間表示通過計算估計值所在的區間。 信心水準表示準確值落在這個區間的機率。 信賴區間表示具體值範圍,信心水準是個機率值。例如:估計某件事件完成會在10~12日之間,但這個估計準確性大約只有80%:表示信賴區間(10,12),信心水準80%。要想提高信心水準,就要放寬置信空間。

理論描述[編輯]

定義[編輯]

隨機區間[編輯]

對於一組給定的數據,定義 \Omega 為觀測對象,W 為所有可能的觀測結果,X 為實際上的觀測值,那麼 X 實際上是一個定義在\Omega上,值域在 W 上的隨機變數。這時,信賴區間的定義是一對函數 u(.) 以及 v(.) ,也就是說,對於某個觀測值X = x,其信賴區間為(u(x), v(x)) 。實際上,若真實值為w,那麼信心水準就是機率 c

c=\Pr(u(X)<w<v(X)).

其中U = u(X) 和 V = v(X) 都是統計量(即可觀測的隨機變數),而信賴區間因此也是一個隨機區間:(U, V)。

參考文獻[編輯]