[파이썬 머신러닝 가이드] 차원 축소 - PCA (Principal Component Analysis)
PCA (Principal Component Analysis) data가 많이 있는 축 → 주성분 = principal component(데이터가 주로 분포한 축, 성분) 데이터의 특성을 가장 잘 살릴 수 있는, 가장 많이 분포해있는 축으로 축소시켜야 함. Covariance(공분산)이란? 보통 분산은 한 개의 특정한 변수의 데이터 변동을 의미하나, 공분산은 두 변수 간의 변동을 의미함. Cov(X,Y) > 0 → X가 증가할 때, Y도 증가함을 의미. 공분산 행렬은 여려 변수와 관련된 공분산을 포함하는 정방형 행렬. (분산의 multidimension ver.) PCA = covariance를 SVD 해서 그거의 장축을 고르면 됨. *** PCA는 covariance 구하고, 그 행렬에 SVD 적용해라..