切比雪夫不等式

本页使用了标题或全文手工转换
维基百科,自由的百科全书

切比雪夫不等式(英语:Chebyshev's Inequality),是概率论中的一个不等式,显示了随机变量的“几乎所有”值都会“接近”平均。在20世纪30年代至40年代刊行的书中,其被称为比奈梅不等式(Bienaymé Inequality)或比奈梅-切比雪夫不等式(Bienaymé-Chebyshev Inequality)。切比雪夫不等式对任何分布数据都适用。

切比雪夫不等式可表示为以下形式:对于任何随机变量 和实数 ,都有 ,其中 表示 数学期望方差

概念[编辑]

这个不等式以数量化这方式来描述,究竟“几乎所有”是多少,“接近”又有多接近:

  • 与平均相差2个标准差以上的值,数目不多于1/4
  • 与平均相差3个标准差以上的值,数目不多于1/9
  • 与平均相差4个标准差以上的值,数目不多于1/16

……

  • 与平均相差k个标准差以上的值,数目不多于1/k2

举例说,若一班有36个学生,而在一次考试中,平均分是80分,标准差是10分,我们便可得出结论:少于50分或多于110分(与平均相差3个标准差以上)的人,数目不多于4个(=36*1/9)。
公式:

推论[编辑]

测度论说法[编辑]

设(X,Σ,μ)为一测度空间f为定义在X上的广义实可测函数。对于任意实数t > 0,

一般而言,若g是非负广义实值可测函数,在f的定义域非降,则有

上面的陈述,可透过以|f|取代f,再取如下定义而得:

概率论说法[编辑]

为随机变量,期望标准差。对于任何实数k>0,

改进[编辑]

一般而言,切比雪夫不等式给出的上界已无法改进。考虑下面例子:

这个分布的标准差

对于任意分布形态的数据,根据切比雪夫不等式,至少有 的数据落在k个标准差之内。其中k>1,但不一定是整数。

当只求其中一边的值的时候,有Cantelli不等式

[1]页面存档备份,存于互联网档案馆

证明[编辑]

定义,设为集指示函数,有

又可从马尔可夫不等式直接证明:马氏不等式说明对任意随机变量Y和正数a。取

亦可从概率论的原理和定义开始证明:

参见[编辑]

参考来源[编辑]

  • 《基本统计学 观念与应用二版》,林惠玲 陈正仓 著
  • 《应用统计学 第四版》 修订版,林惠玲 陈正仓 著