Big Data(4)
-
[딥러닝] 로지스틱 회귀(Logistic (regression)classification)
로지스틱 분류(Logistic classification)란? 선형 회귀 분석과는 다르게 종속 변수가 범주형 데이터를 대상으로 하며 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 분류기법으로도 볼 수 있다. 시그모이드 함수(sigmoid function) / 로지스틱 함수(logistic function) 란? S자형 곡선 또는 시그모이드 곡선을 갖는 함수를 의미한다. 미분가능한 함수이며, 모든 점에서의 미분값은 양수이다. ▶ 시그모이드 함수 ▶ 시그모이드 함수 그래프 표현 1) Hypothesis(가설) : 시그모이드 함수를 활용 2) Cost Function ▶ y = 1 일 경우 ▶ y = 0 일 경우 3. 경사하강법(Gradient descent algorith..
2020.07.06 -
[딥러닝] 선형회귀(Linear Regression)
선형회귀(Linear Regression) 란? 선형 회귀는 종속 변수 y 와 한 개 이상의 독립 변수 x와의 선형 상관 관계를 모델링하는 회귀분석 기법이며, 한 개의 설명 변수에 기반하는 경우는 단순 선형 회귀, 둘 이상의 설명 변수에 기반한 경우에는 다중 선형 회귀라고 한다. 1. 입력(feature) 인스턴스가 한가지 일경우 1) Hypothesis(가설) 2) Cost/Loss function 2. 입력(feature) 인스턴스가 다수일 경우 1-1) Hypothesis(가설) 1-2) Matrix를 이용한 Hypothesis(가설) 설정풀이 2) Cost/Loss function 3. 경사하강법(Gradient descent algorithm) ※ cost(경사도) 측정(미분작업)을 반복하여 c..
2020.07.05 -
[머신러닝] 지도학습의 분류 알고리즘 : K-최근접 이웃(KNN - K-Nearest Neighbors)
KNN(K-Nearest Neighbors)¶ 중요 : 이웃의 갯수에 의해 판단된다 1) 특징 - 이해하기 쉽고 직관적인 모델 - 더 복잡한 알고리즘을 적응하기 전에 시도해 볼 수 있는 모델 - 훈련셋이 너무 크면 예측이 느려진다. 2) (하이퍼)파라미터 - n_neighbors : 이웃의 갯수(k갯수) - 데이터 사이의 거리를 재는 방법 : L2 norm 사용 import 작업¶ In [1]: from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier from sklearn.neighbors ..
2020.07.01 -
[머신러닝] 지도학습(Supervised Learing)/비지도 학습(Unsupervised Learing)/강화 학습(Reinforcement Learning) 정의
지도학습(Supervised Learing) 컴퓨터에게 정답(Label)이 무엇인지 알려주면서 컴퓨터를 학습하는 방법이다. 지도학습은 분류(Classification)와 회기(Regresssion)로 나뉜다. 1) 분류(Classification) 주어진 데이터를 정해진 카테고리에 따라 분류하는 것을 의미한다. 분류는 예측하는 class의 가짓수에 따라 이진 분류(Binary classification) , 다중 분류(Multi-class classification) 로 나뉜다. 1. 이진 분류(Binary classification) : 예, 아니요와 같이 두 가지 class로 구분될 수 있는 분류 2. 다중 분류(Multi-class classification) : 여러가지 class로 구분될 수 있..
2020.06.30