선형 모델

입력 특성에 대한 선형 함수를 만들어 예측 수행

$\hat y = w[0]x[0] + w[1] x[1] + ... + w[p]*x[p] + b$

y hat : 모델이 만들어낸 예측값

w & b : 학습할 파라미터

x[n] : 데이터 포인트에 대한 특성 (특성의 개수 : p+1)

특성이 하나인 데이터셋

$\hat y = w[0]*x[0]+b$ → w[0] = 기울기 & y절편 = b ⇒ 특성이 많아지면 w는 각 특성에 해당하는 기울기 모두 가짐

즉, 예측값은 입력 특성에 w의 각 가중치를 곱해서 더한 가중치의 합

mglearn.plots.plot_linear_regression_wave()

스크린샷 2022-03-14 오후 7.05.25.png

Q : 직선을 사용한 예측 → 제약 多 = 상세 정보 잃어버린 것과 같은지 ?

A : 선형 조합이라는 가정 → 비현실적, BUT 특성이 많은 데이터셋은 훌륭 성능 가능 !

(cf) 훈련 데이터 < 특성 → 완벽하게 훈련셋에 대해 선형 함수로 모델링 가능