Big Data/Machine Learing(2)
-
[머신러닝] 지도학습의 분류 알고리즘 : K-최근접 이웃(KNN - K-Nearest Neighbors)
KNN(K-Nearest Neighbors)¶ 중요 : 이웃의 갯수에 의해 판단된다 1) 특징 - 이해하기 쉽고 직관적인 모델 - 더 복잡한 알고리즘을 적응하기 전에 시도해 볼 수 있는 모델 - 훈련셋이 너무 크면 예측이 느려진다. 2) (하이퍼)파라미터 - n_neighbors : 이웃의 갯수(k갯수) - 데이터 사이의 거리를 재는 방법 : L2 norm 사용 import 작업¶ In [1]: from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.neighbors ..
2020.07.01 -
[머신러닝] 지도학습(Supervised Learing)/비지도 학습(Unsupervised Learing)/강화 학습(Reinforcement Learning) 정의
지도학습(Supervised Learing) 컴퓨터에게 정답(Label)이 무엇인지 알려주면서 컴퓨터를 학습하는 방법이다. 지도학습은 분류(Classification)와 회기(Regresssion)로 나뉜다. 1) 분류(Classification) 주어진 데이터를 정해진 카테고리에 따라 분류하는 것을 의미한다. 분류는 예측하는 class의 가짓수에 따라 이진 분류(Binary classification) , 다중 분류(Multi-class classification) 로 나뉜다. 1. 이진 분류(Binary classification) : 예, 아니요와 같이 두 가지 class로 구분될 수 있는 분류 2. 다중 분류(Multi-class classification) : 여러가지 class로 구분될 수 있..
2020.06.30