迴歸分析
维基百科,自由的百科全书
(重定向自回归分析)
迴歸分析(Regression Analysis)是一種統計學上分析數據的方法,主要是希望探討數據之間是否有一種特定關係。迴歸分析是建立因變數Y(或稱依變數、原文為:response variables, dependent variables)與自變數X(或稱獨變數,原文為predictors, independent variables)之間關係的模型。複迴歸(Multiple regression)指的是超過一個自變數。迴歸分析的目的在於了解兩個或多個變數間是否相關、相關方向與強度,並建立數學模型以便觀察特定變數來預測研究者感興趣的變數。
目录 |
[编辑] 起源
「迴歸」(或作「回歸」)一詞最早由法蘭西斯·高爾頓(Francis Galton)所使用。他曾對親子間的身高做研究,發現父母的身高雖然會遺傳給子女,但子女的身高卻有逐漸「回歸到中等(即人的平均值)」的現象。不過當時的迴歸和現在的迴歸在意義上已不盡相同。
[编辑] 回歸分析原理
- 目的在於找出一條最能夠代表所有觀測資料的函數(迴歸估計式)。
- 用此函數代表因變數和自變數之間的關係。
[编辑] 參數估計
- 動差法(Method of Moment、MOM)
- 最小平方法(Ordinary least square estimation, OLSE)
- 最大概似估計法(Maximum likelihood estimation, MLE)
- 機率圖法(Probability Plot Method)
[编辑] 回归模型
回归模型主要包括以下变量:
- 未知参数β,可以是标量或向量
- 自变量X
- 因变量Y
回归模型将Y和一个关于X和β的函数关联起来。
[编辑] 回歸分析的種類
[编辑] 簡單線性回歸分析
- 應用時機
- 以單一變數預測
- 判斷兩變數之間相關的方向和程度
[编辑] 複回歸(或多變量回歸分析)
- 複回歸分析(multiple-regression-analysis)是簡單相關的一種延伸應用,用以瞭解一個依變項與兩組以上獨變項的函數關係。
