목록PCA (1)
Hippo's data

오늘은 PCA(Principal Component Analysis) 주성분 분석에 대해 알아보겠습니다!! 주성분 분석은 데이터의 차원을 줄이는(차원축소) 방법인데요 데이터의 분산을 최대한으로 유지하는 것이 포인트입니다 # 왜 분산을 최대한으로 유지해야하는가? -> 우리의 목적은 정보의 손실을 최대한 줄이면서 차원을 축소하는 것 -> 데이터들이 많이 흩어져 있어야 차원을 줄일때(투영, projection) 겹치는 부분이 적어짐 -> 겹치는 부분인 적으면 그만큼 정보의 손실을 방지할 수 있음 # 사용목적? 1. 시각화 -> 데이터가 3차원 이상의 데이터는 한 눈에 시각화 하기 어려우므로 차원 축소를 통해 시각화에 활용하기 위함 2. 노이즈 줄이기 -> 쓸모없는 특성들을 없애서 노이즈를 줄이기 위함 3. 전처..
ML(Machine Learning)
2024. 1. 14. 00:07