목록k-nn (2)
Hippo's data
이제부터 지도학습 알고리즘에 대해 알아보겠습니다 # 지도학습이란? -> 입력데이터를 통해 출력을 맞추는 것 맞추는 방식은 크게 2가지로 나뉘는데요 1. 분류 classifiaction 2. 회귀 regression # 분류classifiaction -> 여러 클래스 중 하나를 맞추는 것(예측하기) (이진binary 분류 - 두개 클래스로 분류 / 다중multicalss 분류 - 셋 이상의 클래스로 분류) 예) 스팸이메일 분류(Yes or No) / ch1의 붓꽃의 꽃잎, 꽃받침의 폭과 길이로 품종 예측 # 회귀 regression -> 연속적인 숫자(실수)를 맞추는 것 예) 교육수준, 나이, 거주지 등을 이용해 소득을 예측 # 일반화, 과대적합, 과소적합 훈련데이터를 통해 학습한 모델이 새로운 데이터도 ..
머신러닝 입문에서 자주 등장하는 '붓꽃 품종 분류'를 진행해보겠습니다 목적: 품종구분된 데이터로 새로 채집한 붓꽃 품종 예측하기(지도학습 & 분류classification) 클래스(class) - 붓꽃 종류(3개) :'setosa' 'versicolor' 'virginica' 특성(피쳐) (4개) : 'sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)' -> 붓꽃의 꽃잎(petal), 꽃받침(sepal)의 폭(width)과 길이(length) # 라이브러리 불러오기 & 버전확인 import sys print("Python 버전:", sys.version) import pandas as pd print("pandas..