切比雪夫不等式(英語:Chebyshev's Inequality),是概率论中的一个不等式,顯示了隨機變量的「幾乎所有」值都會「接近」平均。在20世纪30年代至40年代刊行的书中,其被称为比奈梅不等式(Bienaymé Inequality)或比奈梅-切比雪夫不等式(Bienaymé-Chebyshev Inequality)。切比雪夫不等式对任何分布数据都适用。
切比雪夫不等式可表示为以下形式:对于任何随机变量
和实数
,都有
,其中
表示
的数学期望,
为
的方差。
這個不等式以數量化這方式來描述,究竟「幾乎所有」是多少,「接近」又有多接近:
- 與平均相差2個標準差以上的值,數目不多於1/4
- 與平均相差3個標準差以上的值,數目不多於1/9
- 與平均相差4個標準差以上的值,數目不多於1/16
……
舉例說,若一班有36個學生,而在一次考試中,平均分是80分,標準差是10分,我們便可得出結論:少於50分或多於110分(與平均相差3個標準差以上)的人,數目不多於4個(=36*1/9)。
公式:
測度論說法[编辑]
設(X,Σ,μ)為一測度空間,f為定義在X上的廣義實值可測函數。對於任意實數t > 0,
![{\displaystyle \mu (\{x\in X\,:\,\,|f(x)|\geq t\})\leq {1 \over t^{2}}\int _{X}f^{2}\,d\mu .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d28ff93d04c72a1d886bc75a8c8495f2e52564c2)
一般而言,若g是非負廣義實值可測函數,在f的定義域非降,則有
![{\displaystyle \mu (\{x\in X\,:\,\,f(x)\geq t\})\leq {1 \over g(t)}\int _{X}g\circ f\,d\mu .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/217f5f7f47cffabb859156d34b1006b6794c347a)
上面的陳述,可透過以|f|取代f,再取如下定義而得:
![{\displaystyle g(t)={\begin{cases}t^{2}&{\mbox{if }}t\geq 0\\0&{\mbox{otherwise,}}\end{cases}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/63780af72529b76d8fcb368051eed9accc1a7b47)
概率論說法[编辑]
設
為隨機變量,期望值為
,标准差為
。對於任何實數k>0,
![{\displaystyle \Pr(\left|X-\mu \right|\geq k\sigma )\leq {\frac {1}{k^{2}}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a05ac068ad165b1b987b6d660d216371c0212303)
一般而言,切比雪夫不等式給出的上界已無法改進。考慮下面例子:
![{\displaystyle \Pr(X=1)=\Pr(X=-1)=1/(2k^{2})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee340de579a4cc883a81ac99419e4cc204c53dbc)
![{\displaystyle \Pr(X=0)=1-1/k^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/0693532c357ae2d183c5a81619a27cf841381822)
這個分布的標準差
,
。
对于任意分布形态的数据,根据切比雪夫不等式,至少有
的数据落在k个标准差之内。其中k>1,但不一定是整数。
當只求其中一邊的值的時候,有Cantelli不等式:
[1] (页面存档备份,存于互联网档案馆)
定義
,設
為集
的指示函数,有
![{\displaystyle 0\leq g(t)1_{A_{t}}\leq g\circ f\,1_{A_{t}}\leq g\circ f,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/302eb438f0b0b38dd07eb89bdf59faf8dc8978d7)
![{\displaystyle g(t)\mu (A_{t})=\int _{X}g(t)1_{A_{t}}\,d\mu \leq \int _{A_{t}}g\circ f\,d\mu \leq \int _{X}g\circ f\,d\mu .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4cf534083ee18c7ac79925b648a2264b7ff50203)
又可從馬爾可夫不等式直接證明:馬氏不等式說明對任意隨機變量Y和正數a有
。取
及
。
亦可從概率論的原理和定義開始證明:
![{\displaystyle \Pr(|X-\mu |\geq k\sigma )=\operatorname {E} (I_{|X-\mu |\geq k\sigma })=\operatorname {E} (I_{[(X-\mu )/(k\sigma )]^{2}\geq 1})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/878b20d0b06975629e518238b8722d3f4d94261a)
![{\displaystyle \leq \operatorname {E} \left(\left({X-\mu \over k\sigma }\right)^{2}\right)={1 \over k^{2}}{\operatorname {E} ((X-\mu )^{2}) \over \sigma ^{2}}={1 \over k^{2}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ba0303d9ce814b8551ce193ae0892e9af7f72b3d)
参考来源[编辑]
- 《基本統計學 觀念與應用二版》,林惠玲 陳正倉 著
- 《應用統計學 第四版》 修訂版,林惠玲 陳正倉 著