머신러닝 기초지식
머신러닝은 크게 3가지 분야로 나누어 볼 수 있습니다.
지도학습(Supervised Learning)
, 비지도학습(Unsupervised Learning)
, 강화학습(Reinforcement Learning)
지도학습과 비지도학습의 궁극적인 목표는 과거, 현재의 데이터로부터 미래를 예측하는 것입니다.
다만, 두 가지의 차이점은 라벨링이된 데이터인지 아닌지에 따라 결정됩니다.
데이터 종류 | 학습 종류 |
---|---|
라벨링된 데이터(labeld data) | 지도학습 |
라벨링되지 않은 데이터(Unlabeled data) | 비지도학습 |
여기서 라벨링된 데이터는 데이터에 대한 답이 존재하는 것을 말합니다.
Supervised Learning(지도학습)
만일 내가 가진 데이터가 라벨링되어 있다면 지도학습이라고 볼 수 있습니다. (정답을 알고 있음)
지도학습은 Classification과 Regression으로 나뉩니다.
Classification(분류)
주어진 데이터를 정해진 카테고리에 따라 분류하는 문제를 말합니다.
ex) 과자생성공장에서, 해당 과자가 불량품이지 아닌지를 판단하여 불량품이라면 바람으로 날려버림
Regression(회귀)
연속된 값을 예측하는 문제를 말합니다. 주로 어떤 패턴이나 트렌드, 경향을 예측할 때 사용됩니다.
ex) 키와 몸무게에 대한 데이터를 주어주고, 임의의 키 x에 대해 몸무게가 몇 kg가 될지 예측할 때 사용
Unsupervised Learning(비지도 학습)
라벨링되지 않은 데이터를 가지고(정답이 없음) 데이터를 군집화하는 것을 말합니다.
예를 들어 고양이, 병아리, 기린, 호랑이 사진을 비지도학습 시킨다고 가정하면,
각 사진이 무슨 동물인지 정답(label)을 모르기 때문에 이 동물이 '무엇'인지는 모르나 비슷한 단위로 군집화를 해줍니다.
다리가 4개인 고양이와 호랑이를 한 분류로 묶고,
다리가 4개지만 목이 긴 기린은 다른 분류로,
다리가 얇고 몸통이 둥그런 병아리는 또 다른 분류로 나눌 것 입니다.
Reinforcement Learning(강화학습)
강화학습이란, 자신이한 행동에 대한 "보상"을 알 수 있어서 그로부터 학습하는 것을 말합니다.
상과 벌이라는 보상(reward)을 주며 상을 최대화하고 벌을 최소화 하도록 학습하는 방식입니다.
'AI 노트 > 머신러닝' 카테고리의 다른 글
[머신러닝]linearRegression(선형회귀) (0) | 2019.01.17 |
---|---|
[머신러닝] 지도학습 (0) | 2019.01.06 |