跳转到内容

均方根误差:修订间差异

维基百科,自由的百科全书
删除的内容 添加的内容
无编辑摘要
标签移除维护性模板
无编辑摘要
第6行: 第6行:
{{Not|均方误差|均方差}}
{{Not|均方误差|均方差}}


'''均方根偏差'''({{Lang-en|root-mean-square deviation}},'''RMSD''')或'''均方根误差'''({{Lang|en|root-mean-square error}},'''RMSE''')是常用於衡量模型预测值或[[估计量]](样本值或总体值)与观测值之间差异的一种指标。均方根偏差代表預測值和觀察值之差的二阶样本[[矩 (數學)|矩]]的平方根(樣本[[標準差]]),或該差值的[[平方平均数]]。當這些[[离差]]是以用來計算估計量的數據樣本本身來計算時,通常稱差值為[[殘差]]({{lang|en|residual}});當差值不基於樣本得出的估計量時,通常稱為误差({{lang|en|error}})或預測誤差({{lang|en|prediction errors}})。均方根誤差主要作用是將各個數據點的預測誤差大小聚集為一個預測力的度量。均方根誤差是[[测量精度]]的度量,用于比较特定数据集的不同模型的预测误差,数据集之间的预测误差,因为它是尺度依賴的。<ref>{{cite journal|last=Hyndman|first=Rob J.|last2=Koehler|first2=Anne B.|title=Another look at measures of forecast accuracy|journal=International Journal of Forecasting|year=2006|pages=679–688|doi=10.1016/j.ijforecast.2006.03.001|volume=22|issue=4|citeseerx=10.1.1.154.9771}}</ref>
'''均方根偏差'''('''均方根差''',{{Lang-en|root-mean-square deviation}},'''RMSD''')或'''均方根误差'''({{Lang|en|root-mean-square error}},'''RMSE''')是常用於衡量模型预测值或[[估计量]](样本值或总体值)与观测值之间差异的一种指标。均方根偏差代表預測值和觀察值之差的二阶样本[[矩 (數學)|矩]]的平方根(樣本[[標準差]]),或該差值的[[平方平均数]]。當這些[[离差]]是以用來計算估計量的數據樣本本身來計算時,通常稱差值為[[殘差]]({{lang|en|residual}});當差值不基於樣本得出的估計量時,通常稱為误差({{lang|en|error}})或預測誤差({{lang|en|prediction errors}})。均方根誤差主要作用是將各個數據點的預測誤差大小彙總為一個預測力的度量。均方根誤差是[[测量精度|精度]]的度量,用于比较特定数据集的不同模型的预测误差,能比較数据集之间的预测误差,因为它是尺度依賴的。<ref>{{cite journal|last=Hyndman|first=Rob J.|last2=Koehler|first2=Anne B.|title=Another look at measures of forecast accuracy|journal=International Journal of Forecasting|year=2006|pages=679–688|doi=10.1016/j.ijforecast.2006.03.001|volume=22|issue=4|citeseerx=10.1.1.154.9771}}</ref>


均方根誤差總是非負的,值為0(實際極少出現)的情況表示與數據完全吻合。一般而言,低RMSD比高RMSD要好。然而,在不同類型的數據之間進行比較是無意義的,因為度量取決於所使用的數字的尺度。

均方根誤差是平方誤差平均值的平方根。各個誤差對均方根誤差的影響與平方誤差的大小成正比;因此,較大的誤差對均方根誤差有不成比例的大影響。因此,均方根誤差對離群值很敏感。<ref name=":0">{{Cite journal|last=Pontius|first=Robert|last2=Thontteh|first2=Olufunmilayo|last3=Chen|first3=Hao|date=2008|title=Components of information for multiple resolution comparison between maps that share a real variable|journal=Environmental Ecological Statistics|volume=15|issue=2|pages=111–142|doi=10.1007/s10651-007-0043-y}}</ref><ref>{{Cite journal|last=Willmott|first=Cort|last2=Matsuura|first2=Kenji|date=2006|title=On the use of dimensioned measures of error to evaluate the performance of spatial interpolators|journal=International Journal of Geographical Information Science|volume=20|pages=89–102|doi=10.1080/13658810500286976}}</ref>


== 方程式 ==
== 方程式 ==
第35行: 第38行:


==應用==
==應用==
*在[[气象学]]上,可用來評估一個數值模型可以多好預測[[大氣層]]的行為。
*在[[气象学]]上,可用來評估一個數值模型可以多好預測[[大氣層]]的行為。
*在[[生物資訊學]]中,均方根差被用來量測重疊蛋白質(superimposed proteins)分子間的距離。
*在[[生物資訊學]]中,均方根差被用來量測重疊蛋白質(superimposed proteins)分子間的距離。
*在結構藥物設計中,均方根差被用來測量[[配體]](ligand)的晶格構造以及對接預測(docking prediction)。
*在結構藥物設計中,均方根差被用來測量[[配體]](ligand)的晶格構造以及對接預測(docking prediction)。
*在[[經濟學]]中,均方根差被用來覺得一個模型是否合經濟指標。部分專家曾提出均方根差相對絕對誤差(relative absolute error)來的不可靠。
*在[[經濟學]]中,均方根差被用來確定一個模型是否合經濟指標。部分專家曾提出均方根差不如相對絕對誤差(relative absolute error)可靠。<ref>{{cite journal|url= http://faculty.weatherhead.case.edu/Fred-Collopy/researchArticles/ErrorMeasures.pdf | title = Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons |last=Armstrong |first=J. Scott |last2=Collopy |first2=Fred |journal = International Journal of Forecasting | volume = 8 | pages = 69–80 | year = 1992 | doi=10.1016/0169-2070(92)90008-w | issue=1| citeseerx = 10.1.1.423.508 }}</ref>
*在實驗心理學中,分均根差被用來指示一個數學或計算行為模型(mathematical or computational models)能解釋實際觀察行為的良好程度。
*在實驗心理學中,分均根差被用來指示一個數學或計算行為模型(mathematical or computational models)能解釋實際觀察行為的良好程度。
*在[[地理信息系统|地理-{zh-cn:信息; zh-tw:資訊;}-系統]](GIS)中,均方根誤差是一種用來評價[[空间分析]]和[[遥感|-{zh-cn:遥感; zh-hk:遙感; zh-tw:遙測;}-]]精度的量度。
*在[[地理信息系统|地理-{zh-cn:信息; zh-tw:資訊;}-系統]](GIS)中,均方根誤差是一種用來評價[[空间分析]]和[[遥感|-{zh-cn:遥感; zh-hk:遙感; zh-tw:遙測;}-]]精度的量度。
*在[[水文地質學]]中,均方根差和正規化均方根差被用來評估地下水模型校正。<ref>{{cite book |title=Applied Groundwater Modeling: Simulation of Flow and Advective Transport |publisher=Academic Press |year=1992 |last=Anderson |first=M.P. |author2=Woessner, W.W. |edition=2nd}}</ref>
*在[[水文地質學]]中,均方根差和正規化均方根差被用來評估地下水模型校正。<ref>{{cite book |title=Applied Groundwater Modeling: Simulation of Flow and Advective Transport |publisher=Academic Press |year=1992 |last=Anderson |first=M.P. |author2=Woessner, W.W. |edition=2nd}}</ref>
*在影像科學中,均方根差是一種峰值[[信噪比|-{zh-cn:信噪比; zh-tw:訊噪比;}-]],是一種用來檢視一個方法能多好地重建原來的像。
*在影像科學中,均方根差是一種[[峰值信噪比|峰值-{zh-cn:信噪比; zh-tw:訊噪比;}-]],是一種用來評價一個方法相對原始圖像能多好地重建原來的的方法
*在[[計算神經科學]]中,均方根差被用來檢視一個系統能學習一個給定模型的能力。<ref>{{Cite web |url=http://www.ocgy.ubc.ca/projects/clim.pred/NN/3.1/model.html |title=Ensemble Neural Network Model}}</ref>
*在[[計算神經科學]]中,均方根差被用來檢視一個系統能學習一個給定模型的能力。<ref>{{Cite web |url=http://www.ocgy.ubc.ca/projects/clim.pred/NN/3.1/model.html |title=Ensemble Neural Network Model}}</ref>
*在[[蛋白質]]核磁共振光譜學中,均方根差被用來當作一個評估結構品質的量度。
*在[[蛋白質]]核磁共振光譜學中,均方根差被用來當作一個評估結構品質的量度。

2022年6月16日 (四) 04:32的版本

均方根偏差均方根差,英語:root-mean-square deviationRMSD)或均方根误差root-mean-square errorRMSE)是常用於衡量模型预测值或估计量(样本值或总体值)与观测值之间差异的一种指标。均方根偏差代表預測值和觀察值之差的二阶样本的平方根(樣本標準差),或該差值的平方平均数。當這些离差是以用來計算估計量的數據樣本本身來計算時,通常稱差值為殘差residual);當差值不基於樣本得出的估計量時,通常稱為误差(error)或預測誤差(prediction errors)。均方根誤差主要作用是將各個數據點的預測的誤差大小彙總為一個預測力的度量。均方根誤差是精度的度量,用于比较特定数据集的不同模型的预测误差,但不能比較数据集之间的预测误差,因为它是尺度依賴的。[1]

均方根誤差總是非負的,值為0(實際極少出現)的情況表示與數據完全吻合。一般而言,低RMSD比高RMSD要好。然而,在不同類型的數據之間進行比較是無意義的,因為度量取決於所使用的數字的尺度。

均方根誤差是平方誤差平均值的平方根。各個誤差對均方根誤差的影響與平方誤差的大小成正比;因此,較大的誤差對均方根誤差有不成比例的大影響。因此,均方根誤差對離群值很敏感。[2][3]

方程式

均方根誤差的定義是估计量之差期望值的平方根:

對一個无偏估计量(unbiased estimator)來說,均方根差是變異數的平方根,即標準差

均方根差的預測值對時間t的迴歸應變項(自变量和因变量是以n個不同的預測來做為其均方差的平方根:

在某些情況下,均方根差被用來比較兩個物品之間的不同(可能沒有任一個物品被視為「標準」)。例如,當我們在量測兩個時間序列時,均方根偏差的式子會變成

正規化的均方根誤差

正規化的均方根誤差可以使得不同數值範圍的資料集更易於比較。雖然目前並沒有一個一致性的方法來正規化均方根差,但較常用平均值或是資料的範圍來正規化被量測的資料。

or .

這個值常被用來指正規化的均方根偏差或誤差,同時也常常被表示成比例。當比例的值較低時,代表較少的殘差變異。在很多情況下,特別是取較小的樣本的時候,樣本的範圍容易被樣本的大小影響,其準確度可能就受到影響。

當以平均值來正規化量測值時,均方根差的變異係數可能被用來避免混淆。這和均方根差在標準差上的變異係數是相同的。

應用

  • 气象学上,可用來評估一個數值模型可以多好地預測大氣層的行為。
  • 生物資訊學中,均方根差被用來量測重疊蛋白質(superimposed proteins)分子間的距離。
  • 在結構藥物設計中,均方根差被用來測量配體(ligand)的晶格構造以及對接預測(docking prediction)。
  • 經濟學中,均方根差被用來確定一個模型是否吻合經濟指標。部分專家曾提出均方根差不如相對絕對誤差(relative absolute error)可靠。[4]
  • 在實驗心理學中,分均根差被用來指示一個數學或計算行為模型(mathematical or computational models)能解釋實際觀察行為的良好程度。
  • 地理信息系統(GIS)中,均方根誤差是一種用來評價空间分析遥感精度的量度。
  • 水文地質學中,均方根差和正規化均方根差被用來評估地下水模型校正。[5]
  • 在影像科學中,均方根差是一種峰值信噪比,是一種用來評價一個方法相對原始圖像能多好地重建原來的圖像的方法。
  • 計算神經科學中,均方根差被用來檢視一個系統能學習一個給定模型的能力。[6]
  • 蛋白質核磁共振光譜學中,均方根差被用來當作一個評估結構品質的量度。

参考文献

  1. ^ Hyndman, Rob J.; Koehler, Anne B. Another look at measures of forecast accuracy. International Journal of Forecasting. 2006, 22 (4): 679–688. CiteSeerX 10.1.1.154.9771可免费查阅. doi:10.1016/j.ijforecast.2006.03.001. 
  2. ^ Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao. Components of information for multiple resolution comparison between maps that share a real variable. Environmental Ecological Statistics. 2008, 15 (2): 111–142. doi:10.1007/s10651-007-0043-y. 
  3. ^ Willmott, Cort; Matsuura, Kenji. On the use of dimensioned measures of error to evaluate the performance of spatial interpolators. International Journal of Geographical Information Science. 2006, 20: 89–102. doi:10.1080/13658810500286976. 
  4. ^ Armstrong, J. Scott; Collopy, Fred. Error Measures For Generalizing About Forecasting Methods: Empirical Comparisons (PDF). International Journal of Forecasting. 1992, 8 (1): 69–80. CiteSeerX 10.1.1.423.508可免费查阅. doi:10.1016/0169-2070(92)90008-w. 
  5. ^ Anderson, M.P.; Woessner, W.W. Applied Groundwater Modeling: Simulation of Flow and Advective Transport 2nd. Academic Press. 1992. 
  6. ^ Ensemble Neural Network Model.