2022.03.14 월
2022.03.18 금
입력 특성에 대한 선형 함수를 만들어 예측 수행
$\hat y = w[0]x[0] + w[1] x[1] + ... + w[p]*x[p] + b$
y hat : 모델이 만들어낸 예측값
w & b : 학습할 파라미터
x[n] : 데이터 포인트에 대한 특성 (특성의 개수 : p+1)
특성이 하나인 데이터셋
$\hat y = w[0]*x[0]+b$ → w[0] = 기울기 & y절편 = b ⇒ 특성이 많아지면 w는 각 특성에 해당하는 기울기 모두 가짐
즉, 예측값은 입력 특성에 w의 각 가중치를 곱해서 더한 가중치의 합
mglearn.plots.plot_linear_regression_wave()
Q : 직선을 사용한 예측 → 제약 多 = 상세 정보 잃어버린 것과 같은지 ?
A : 선형 조합이라는 가정 → 비현실적, BUT 특성이 많은 데이터셋은 훌륭 성능 가능 !
(cf) 훈련 데이터 < 특성 → 완벽하게 훈련셋에 대해 선형 함수로 모델링 가능
회귀를 위한 선형 모델의 특성 개수에 따른 형태
1개 → 직선
2개 → 평면
이상 → 초평면 (hyperplane)