[파이썬 머신러닝 가이드] 군집화 - DBSCAN, 군집화 실습(고객 세그먼테이션)
목차 1. DBSCAN 2. 군집화 실습 - 고객 세그먼테이션 1. DBSCAN 밀도 기반 군집화의 대표적인 알고리즘, 특정 공간에서 가까이 있는 데이터가 많아 붐비는 지역(밀집지역)의 포인트를 찾음 → 특정 데이터를 중심으로 밀도가 높은 곳에 포함된 데이터에는 클러스터를 할당함(서로 인접한 데이터들은 같은 클러스터) ** 특정 공간 내에 데이터 밀도 차이를 기반 알고리즘으로 하고 있어서 복잡한 기하학적 분포도를 가진 데이터 세트에 대해서도 군집화를 잘 수행함 ex) 내부의 원 모양과 외부의 원 모양 형태의 분포를 가진 데이터 셋 이런 형태의 데이터는 K-Means와 GMM 보다 훨씬 분류를 잘한다. 가장 중요한 두 가지 파라미터 입실론 주변 영역(epsilon) : 개별 데이터를 중심으로 입실론 반경을..