跳至內容

經驗分布函數

維基百科,自由的百科全書
藍線為經驗分布函數,黑色長條表示相應的樣本,綠線則是用於生成樣本的累積分布函數。

經驗分布函數(英語:empirical distribution function)是統計學中一個與樣本經驗測度有關的分布函數。該累積分布函數是在所有n個數據點上都跳躍1/n階躍函數。對被測變量的某個值而言,該值的分布函數值表示所有觀測樣本中小於或等於該值的樣本所占的比例。

經驗分布函數是對用於生成樣本的累積分布函數的估計。根據Glivenko–Cantelli定理英語Glivenko–Cantelli_theorem可以證明,經驗分布函數以概率1收斂至這一累積分布函數。

定義

[編輯]

(x1, …, xn)為獨立同分布的的實隨機變量,它們共同的累積分布函數為F(t)。於是,經驗分布函數可定義為 [1][2]

其中為事件A指示函數。對給定的tp = F(t)時的伯努利隨機變量。因而則是期望為nF(t)、方差為nF(t)(1 − F(t))二項隨機變量。這意味着F(t)無偏估計

不過,有些文獻中亦會將經驗分布函數定義為[3][4]

參考文獻

[編輯]
  1. ^ van der Vaart, A.W. Asymptotic statistics. Cambridge University Press. 1998: 265. ISBN 0-521-78450-6. 
  2. ^ PlanetMath 網際網路檔案館存檔,存檔日期May 9, 2013,.
  3. ^ Coles, S. (2001) An Introduction to Statistical Modeling of Extreme Values. Springer, p. 36, Definition 2.4. ISBN 978-1-4471-3675-0.
  4. ^ Madsen, H.O., Krenk, S., Lind, S.C. (2006) Methods of Structural Safety. Dover Publications. p. 148-149. ISBN 0486445976