케이민즈 - 케이니얼니스트의 클러스터링 버젼

k means랑 gmm이랑 거의 비슷함. 차이는 가우시안분포에대한 가정이 있는가 없는가 / 둘다 클러스터의 개수를 지정하고, EM 식으로 둘다 이터레이티브하게 클러스터링을 함. 


Centroid : 무게 중심, 질량 중심 (정확히는 질량 중심인데 해석하는데 큰차이는 없어 보임.)



K-means : K개의 클러스터를 묶어내는 것
(K-means가 EM(Expectation Maximization)의 전형적인 예라고 함.)

Step 1) K개 만큼의 랜덤한 점을 정한다.
Step 2) 각 클러스터의 점들을 계산해서 각각의 Centroid 를 구한다.
Step 3) 입력받은 X1에대해 가장 가까운 Centroid 쪽의 클러스터에 할당한다.
-> 다시 Step 2)로 돌아가서 Centroid를 갱신함.

(사실 이건 휴리스틱임. 원래는 각 클러스터의 분산이 최소가 되게 점을 할당함.)



DataMiningLectureNote2-3,4 latter.pdf



http://unicone.blog.me/60067189849

http://blog.naver.com/hero1014/20198084057

by 곽동현 이스텔리앙 2014.06.11 21:29