2022.03.19 토

결정 트리의 앙상블

Ensemble

: 여러 머신러닝 모델을 연결하여 더 강력한 모델을 만드는 기법

랜덤 포레스트

Random Forest

: 여러 다른 여러 결정 트리 묶음

과대적합 회피 가능

아이디어 : 예측 good + 일부에 과대적합 → 서로 다른 방향으로 과대적합된 트리 많이 만들기 (대신 많이 만들어야 함)

🔼 무작위성 주입

→ 결과 평균내기 → 과대적합 양 ⬇️ 가능!

  1. 생성할 트리 개수 정하기**

    2) 데이터의 부트스트랩 샘플 생성

    3) 결정 트리 만들기 각 노드에서 후보 특성 무작위로 선택 → 그 중 최선의 테스트 찾음