K-mean 알고리즘의 순서
원하는 클러스터의 수(K)를 결정
무작위로 클러스터의 수와 같은 K개의 중심점(centroid)을 선정
이들은 각각의 클러스터를 대표
나머지 점들과 모든 중심점 간의 유클리드 거리를 계산한 후, 가장 가까운 거리를 가지는 중심점의 클러스터에 속하도록 함
각 K개의 클러스터의 중심점을 재조정
특정 클러스터에 속하는 모든 점들의 평균값이 해당 클러스터 다음 iteration의 중심점이 됨(이 중심점은 실제로 존재하는 데이터가 아니어도 상관 없음)
재조정된 중심점을 바탕으로 모든 점들과 새로 조정된 중심점 간의 유클리드 거리를 다시 계산한 후, 가장 가까운 거리를 가지는 클러스터에 해당 점을 재배정
4.번과 5.번을 반복 수행
반복의 횟수는 사용자가 적절히 조절하면 되고, 특정 iteration 이상이 되면 수렴(중심점이 더 이상 바뀌지 않음)
K-means 알고리즘은 다음과 같은 상황에서는 적합하지 않은 군집화 알고리즘