决定系数

维基百科,自由的百科全书
跳到导航 跳到搜索
决定系数示意图 线性回归(右侧)的效果比起平均值(左侧)越好,决定系数的值就越接近于1。 蓝色正方形表示线性回归的残差的平方, 红色正方形数据表示对于平均值的残差的平方。

决定系数(英語:coefficient of determination,记为R2r2)在统计学中用于度量因变量的变异中可由自变量解释部分所占的比例,以此来判断统计模型的解释力。[1][2][3]

对于简单线性回归而言,决定系数为样本相关系数的平方。[4]当加入其他回归自变量后,决定系数相应地变为多重相关系数的平方。

假设一数据集包括y1,...,ynn个观察值,相对应的模型预测值分别为f1,...,fn。定义残差ei = yifi,平均观察值为

于是可以得到总平方和

回归平方和

残差平方和

由此,决定系数可定义为

参考文献[编辑]

  1. ^ Steel, R. G. D.; Torrie, J. H. Principles and Procedures of Statistics with Special Reference to the Biological Sciences. McGraw Hill. 1960. 
  2. ^ Glantz, Stanton A.; Slinker, B. K. Primer of Applied Regression and Analysis of Variance. McGraw-Hill. 1990. ISBN 0-07-023407-8. 
  3. ^ Draper, N. R.; Smith, H. Applied Regression Analysis. Wiley-Interscience. 1998. ISBN 0-471-17082-8. 
  4. ^ Devore, Jay L. Probability and Statistics for Engineering and the Sciences 8th. Boston, MA: Cengage Learning. 2011: 508–510. ISBN 0-538-73352-7.