本页使用了标题或全文手工转换

卡方分佈

维基百科,自由的百科全书
跳转至: 导航搜索
卡方分布
Chi-square distributionPDF.png
概率密度函數
Chi-square distributionCDF.png
累積分佈函數
參數 k > 0\, 自由度
支撑集 x \in [0; +\infty)
概率密度函數 \frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}
累積分佈函數 \frac{\gamma(k/2,x/2)}{\Gamma(k/2)}
期望值 k
中位數 大约k-2/3
眾數 k-2\,,如果k\geq 2
方差 2\,k
偏度 \sqrt{8/k}
峰度 12/k
信息熵 \frac{k}{2}\!+\!\ln(2\Gamma(k/2))\!+\!(1\!-\!k/2)\psi(k/2)
動差生成函數 (1-2\,t)^{-k/2}2\,t<1
特性函数 (1-2\,i\,t)^{-k/2}

卡方分布chi-square distribution, χ²-distribution)是概率论统计学中常用的一种概率分布k独立的标准正态分布变量的平方和服从自由度k的卡方分布。卡方分布是一种特殊的伽玛分布假设检验置信区间的计算。

由卡方分布延伸出來皮爾森卡方檢定常用于: (1)樣本某性質的比例分布與母體理論分布的拟合优度;(2)同一母體的兩個随机变量是否独立;(3)二或多個母體同一屬性的同質性檢定。(詳見皮爾森卡方檢定

数学定义[编辑]

k个随机变量Z_1、……、Z_k是相互独立,符合标准正态分布随机变量数学期望为0、方差为1),则随机变量Z的平方和

X=\sum_{i=1}^k Z_i^2

被称为服从自由度k 的卡方分布,记作

    X\ \sim\ \chi^2(k) \,
   \ X\ \sim\ \chi^2_k

特征[编辑]

卡方分布的概率密度函数为:

f_k(x)=
\frac{(1/2)^{k/2}}{\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}

其中x≥0,当x≤0时f_k(x)=0。这里Γ代表Gamma函数

卡方分布的累积分布函数为:

F_k(x)=\frac{\gamma(k/2,x/2)}{\Gamma(k/2)}

其中γ(k,z)为不完全Gamma函数

在大多数涉及卡方分布的书中都会提供它的累积分布函数的对照表。此外许多表格计算软件如OpenOffice.org Calc和Microsoft Excel中都包括卡方分布函数。

自由度为k的卡方变量的平均值k方差2k。 卡方分布是伽玛分布的一个特例,它的为:

H
=
\int_{-\infty}^\infty f(x)\ln(f(x)) dx
=
\frac{k}{2}
+
\ln
 \left(
  2 \Gamma
  \left(
   \frac{k}{2}
  \right)
 \right)
+
\left(1 - \frac{k}{2}\right)
\psi(k/2)

其中\psi(x)雙伽瑪函數

卡方變數與Gamma變數的關係 當Gamma變數 頻率(λ)為1/2時,α的2倍為卡方變數之自由度(Degree of freedom) 即:

r.v. Y
=
\chi^2 \left(U\right)
=
\Gamma \left( \frac{U}{2} , \frac{1}{2}\right)
E \left( \chi^2 \left(U\right) \right)
=
E \left( Y \right)
=
  \frac{\alpha}{\lambda}
=
\frac{\frac{U}{2}}{\frac{1}{2}}
=
U
Var \left( \chi^2 \left(U\right) \right)
=
Var \left( Y \right)
=
  \frac{\alpha}{\lambda^2}
=
\frac{\frac{U}{2}}{\left(\frac{1}{2}\right)^2}
=
2U

卡方變數之期望值=自由度 卡方變數之方差=两倍自由度

Table of χ2 value vs p-value[编辑]

p-value = 1- p_CDF.

χ2越大: p-value越小, 可信度越高. 通常用p=0.05作为threshold, 即95%的可信度. 常用的χ2与p-value表如下:


自由度 χ2 value[1]
1
0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83
2
0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82
3
0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27
4
0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47
5
1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52
6
1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46
7
2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32
8
2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12
9
3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88
10
3.94 4.86 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59
P value (概率)
0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001

参考文献[编辑]

  1. ^ Chi-Squared Test Table B.2. Dr. Jacqueline S. McLaughlin at The Pennsylvania State University. In turn citing: R.A. Fisher and F. Yates, Statistical Tables for Biological Agricultural and Medical Research, 6th ed., Table IV

外部链接[编辑]