목록지도학습 (2)
Hippo's data
오늘은 지도학습의 분류모델 중 나이브베이즈 분류기에 대해 알아보겠습니다 # 나이브 베이즈 분류기 Naive bayes classifier -> 베이즈 정리 기반 - 사전확률을 통한 사후확률 예측 특성간 독립적 가정 - 나이브한naive (소박한) 가정을 통해 복잡한 문제해결에 좋은 성능 발휘 단점) feature간 독립적이어야함 = feature간 상관관계 없음 -> 선형 분류기LogisticRegression, LinearSVC - Linear support vector classifier) 보다 훈련속도빠름 but 일반화 성능 bad -> 선형모델로 학습시간이 오래걸리는 큰 데이터셋에 나이브베이즈 모델 시도해보자!! -> scikit-learn에 구현되어있는 나이브베이즈 분류기 3개 -> Gaussi..

이제부터 지도학습 알고리즘에 대해 알아보겠습니다 # 지도학습이란? -> 입력데이터를 통해 출력을 맞추는 것 맞추는 방식은 크게 2가지로 나뉘는데요 1. 분류 classifiaction 2. 회귀 regression # 분류classifiaction -> 여러 클래스 중 하나를 맞추는 것(예측하기) (이진binary 분류 - 두개 클래스로 분류 / 다중multicalss 분류 - 셋 이상의 클래스로 분류) 예) 스팸이메일 분류(Yes or No) / ch1의 붓꽃의 꽃잎, 꽃받침의 폭과 길이로 품종 예측 # 회귀 regression -> 연속적인 숫자(실수)를 맞추는 것 예) 교육수준, 나이, 거주지 등을 이용해 소득을 예측 # 일반화, 과대적합, 과소적합 훈련데이터를 통해 학습한 모델이 새로운 데이터도 ..