머신러닝에서 훈련/검증/테스트 세트로 나누는 이유

728x90

일반적으로 머신러닝을 모델링하는 방법의 순서는 아래와 같다.

훈련 작업과 검증작업은 좋은 모델이 나올때까지 반복작업을 하더라도 문제가 없지만 테스트 데이터를 반복적으로 사용하게 된다면 데이터 누수 문제가 발생하여 모델 성능을 잘못 평가하기 때문에 피해야한다.

결정트리(Decision Tree) 이란? (0)	2022.03.02
로지스틱 회귀 (Logistic Regression) (0)	2022.02.25
One-hot encoding과 Ridge Regression (0)	2022.02.24
단순선형회귀모델, 회귀계수 ,사이킷런 (0)	2022.02.22
부트캠프에 관한 불만 (0)	2022.02.22

데이터 분석 입문가