비지도 학습
Unsupervised Learning
알고 있는 출력값이나 정보 없이 학습 알고리즘을 가르쳐야 함
입력 데이터만으로 데이터에서 지식을 추출할 수 있어야 함
3.1 비지도 학습의 종류
- 비지도 변환 (unsupervised transformation)
: 데이터를 새롭게 표현하여 원래 데이터보다 쉽게 해석할 수 있도록 만드는 알고리즘
- 사용되는 분야
차원 축소 (dimensionality reduction) : 특성이 많은 고차원 데이터 → 필요 특징만 포함한 데이터
데이터 구성 단위/성분 찾기 (주제 추출)
- 군집 (clustering)
: 비슷한 것끼리 데이터를 묶는 것
3.2 비지도 학습의 도전 과제
유용한 것을 학습했는지 평가하는 것 어려움
이유 : 비지도 학습 - 보통 레이블 없는 데이터 적용 → 무엇이 올바른 출력인지 모름
그래서,
- 비지도 학습 알고리즘
- 탐색적 분석 단계에서 ****많이 사용
데이터 이해 위해
- 지도학습의 전처리 단계에서 사용
비지도 학습 결과로 새롭게 표현된 데이터 사용하여 학습
3.3 데이터 전처리와 스케일 조정
여러 가지 전처리 방법