728x90
지금까지 머신러닝을 학습하며 일반적으로 train,validation,test로 데이터를 나누어 학습을 해왔다.
하지만 만약 훈련,검증,테스트 자료가 부족하다면 어떻게 해야할까?
그런 질문에 대한 답이 교차검증이 될 수도 있다.
교차검증의 사전적인 의미는 하나의 문제 또는 사건과 같은 일들을 서로 다른 시각, 여러 자료를 토대로 정확성을
높이기 위하여 행하는 가장 기본적인 검사방법이다.
머신런닝에서 교차검증이란 모델링을 위한 훈련용 및 시험용 데이터를 교차 변경하여 검증하는 것이다.
교차검증은 아래와 같은 장점을 가지고 있다.
- 학습에 사용가능한 데이터가 충분하지 않다면 훈련 모델을 이용하여 더욱 일반화 시키는 것이 가능하다.
- 과적합이 방지 될 수 있다.
- 과소적합이 방지될 수 있다.
- 주어진 데이터셋에 학습된 알고리즘이 얼마나 잘 일반화되어있는지 평가하는데 이용할 수 있다.
하지만 반복하여 훈련시키기 때문에 모델링의 시간이 증가한다는 단점이 존재한다.
일반적으로 교차검증에서는 K-겹 교차검증( K-fold croos-validation)을 많이 사용한다고 하니 다음 게시글에선 이에 대해 공부해보자.
'AI > 머신러닝' 카테고리의 다른 글
특성 중요도(feature importance)란? (0) | 2022.03.14 |
---|---|
K-겹 교차검증(k-fold cross-validation) 이란? (0) | 2022.03.07 |
Confusion Matrix란? (0) | 2022.03.04 |
랜덤 포레스트(Random Forests), 앙상블 기법 (0) | 2022.03.03 |
결정트리(Decision Tree) 이란? (0) | 2022.03.02 |
댓글