[머신러닝] 지도학습(Supervised Learing)/비지도 학습(Unsupervised Learing)/강화 학습(Reinforcement Learning) 정의

2020. 6. 30. 18:32Big Data/Machine Learing

반응형

  지도학습(Supervised Learing)

컴퓨터에게 정답(Label)이 무엇인지 알려주면서 컴퓨터를 학습하는 방법이다.

지도학습은 분류(Classification)와 회기(Regresssion)로 나뉜다.


1) 분류(Classification)

주어진 데이터를 정해진 카테고리에 따라 분류하는 것을 의미한다.
분류는 예측하는 class의 가짓수에 따라 이진 분류(Binary classification) , 다중 분류(Multi-class classification) 로 나뉜다.

1. 이진 분류(Binary classification) : 예, 아니요와 같이 두 가지 class로 구분될 수 있는 분류
2. 다중 분류(Multi-class classification) : 여러가지 class로 구분될 수 있는 분류

▶ 분류 알고리즘

  • K-최근접 이웃(KNN : K-Nearest Neighbors)
  • 로지스틱 회귀(Logistic Regression)
  • 의사결정나무(Decision Tree)
  • 랜덤 포레스트(Random Forest)
  • 서포트 벡터 머신(SVM : Support Vector Machine)
  • 나이브 베이즈(Naive Bayes)

2) 회귀(Regression)

어떤 데이터들의 특징(Feature)을 기준으로 연속된 값을 예측하는 것을 의미한다.

회귀 알고리즘

  • 선형 회귀(Linear Regression)
  • 릿지 회귀(Ridge Regression)
  • 라쏘 회귀(Lasso Regression)
  • 엘라스틱넷 회귀(ElasticNet Regression)

  비지도 학습(Unsupervised Learing)

지도 학습과는 달리 정답(label)을 알려주지 않고 비슷한 데이터를 군집화하여 예측하는 학습방법이다.

지도학습에서의 적절한 특징(feature)을 찾아내기 위한 전처리 방법으로 사용되기도 한다.


비지도학습 알고리즘

  • 군집화(Clustering)
  • K-평균(K-means)

  강화 학습(Reinforcement Learning)

상과 벌이라는 보상(reward)을 주며 상을 최대화하고 벌을 최소화 하도록 학습하는 방식이다.

알파고도 강화학습으로 학습되었고, 주로 게임분야에서 최적의 동작을 찾는데 쓰이는 학습 방식이다.


반응형