[파이썬 머신러닝 가이드] 군집화 - 군집 평가 (Clustering Evaluation)
목차 1. inertia 2. silhouette 군집 평가 (Cluster Evaluation) 대부분의 군집화 데이터 세트는 비교할 만한 타깃 레이블을 가지고 있지 않기 때문에 군집화가 효율적으로 잘 됐는지 평가할 수 있는 대표적인 방법으로 실루엣 분석 이용 + inertia 1. inertia inertia = 샘플과 가까운 centroid와의 거리 제곱의 합 or 평균. → 작을수록 좋은 값이나, 처음엔 큰 폭으로 떨어지나 갈수록 작아지는 폭이 줄어듦. cluster 증가할수록 감소함(가까운 cluster가 증가하며 centroid가 증가할테니) but 작아지는 폭이 줄어드는 것. 2. silhouette 분석 ** 내가 속한 cluster의 다른 샘플들과의 거리 = a 나랑 제일 근접한 clus..