K平均演算法

維基百科,自由的百科全書
前往: 導覽搜尋

k-means algorithm演算法是一個聚類演算法,把n個對象根據他們的屬性分為k個分割,k < n。它與處理混合常態分佈最大期望演算法很相似,因為他們都試圖找到數據中自然聚類的中心。

V = \sum_{i=1}^{k} \sum_{x_j \in S_i} (x_j - \mu_i)^2

它假設對象屬性來自於空間向量,並且目標是使各個群組內部的均方誤差總和最小。假設有k個群組Si, i=1,2,...,k。μi是群組Si內所有元素xj的重心,或叫中心點。

參考資料[編輯]

  • J. B. MacQueen (1967): "Some Methods for classification and Analysis of Multivariate Observations", Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1:281-297
  • J. A. Hartigan (1975) "Clustering Algorithms". Wiley.
  • J. A. Hartigan and M. A. Wong (1979) "A K-Means Clustering Algorithm", Applied Statistics, Vol. 28, No. 1, p100-108.
  • D. ArthurS. Vassilvitskii (2006): "How Slow is the k-means Method?," Proceedings of the 2006 Symposium on Computational Geometry (SoCG).

外部連結[編輯]