AI 노트/머신러닝

선형회귀 단순 선형 회귀를 위한 일반화된 예측함수ex) wave 데이터 셋x[0]은 특성(feature), 은 예측 값, b는 편향(bias), w[0]은 가중치(weight) 또는 계수(coefficient) 라고 부름 목표 데이터셋들의 특성들 (x[0], x[1], x[2], .... , x[p])과 라벨값(y) 사이의 관계를 잘 설명해낼 수 있는 적합한 특성 가중치(w[0], w[1], w[2], ..., w[p])와 b(편향)을 찾는 것 HOW? 어떻게 적절한 가중치와 편향을 찾을 까?선형 회귀는 라벨 값(y)과 예측값() 사이의 평균제곱오차(mean squared error, MSE) 를 최소화하는 파라미터 w와 b를 찾는다.(실제 라벨값과 예측값이 작으면 작을수록 예측성능이 좋은 것이기 때문에..
지도학습 지도학습 모델 복잡도와 데이터셋 크기의 관계 모델의 복잡도는 훈련 데이터셋에 담긴 입력 데이터의 다양성과 관련이 깊음 데이터셋에 다양한 데이터 포인트가 많을수록(데이터가 많을 수록) 과대적합 없이 더 복잡한 모델을 만들 수 있음 다양성을 키워주므로 큰 데이터셋은 더 복잡한 모델을 만들 수 있게 해줌 선형모델 => 입력 특성에 대한 선형 함수를 만들어 예측 회귀의 선형 모델 선형모델을 위한 일반화된 예측 함수 y = w[0] * x[0] + w[1] * x[1] ... w[p] * x[p] + b; x[0] ~ x[p] 까지는 데이터 포인트에 대한 특성 w와 b는 모델이 학습할 파라미터 그리고 y은 모델이 만들어낸 예측값 하나라면 y = w[0] * x[0] + b 곧, 예측값은 입력 ..
머신러닝 기초지식 머신러닝 기초지식 머신러닝은 크게 3가지 분야로 나누어 볼 수 있습니다. 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning) 지도학습과 비지도학습의 궁극적인 목표는 과거, 현재의 데이터로부터 미래를 예측하는 것입니다. 다만, 두 가지의 차이점은 라벨링이된 데이터인지 아닌지에 따라 결정됩니다. 데이터 종류학습 종류 라벨링된 데이터(labeld data)지도학습라벨링되지 않은 데이터(Unlabeled data)비지도학습 여기서 라벨링된 데이터는 데이터에 대한 답이 존재하는 것을 말합니다. Supervised Learning(지도학습) 만일 내가 가진 데이터가 라벨링되어 있다면 지도학습이라고..
깡냉쓰
'AI 노트/머신러닝' 카테고리의 글 목록