본문 바로가기
AI/머신러닝

교차검증(Cross-validation)이란?

by 남오공 2022. 3. 7.
728x90

일반적인 학슴 검증 테스트 분할방법

 

지금까지 머신러닝을 학습하며 일반적으로 train,validation,test로 데이터를 나누어 학습을 해왔다.

하지만 만약 훈련,검증,테스트 자료가 부족하다면 어떻게 해야할까? 

그런 질문에 대한 답이 교차검증이 될 수도 있다.

 

교차검증의 사전적인 의미는 하나의 문제 또는 사건과 같은 일들을 서로 다른 시각, 여러 자료를 토대로 정확성을

높이기 위하여 행하는 가장 기본적인 검사방법이다.

 

머신런닝에서 교차검증이란 모델링을 위한 훈련용 및 시험용 데이터를 교차 변경하여 검증하는 것이다.

교차검증은 아래와 같은 장점을 가지고 있다.

  • 학습에 사용가능한 데이터가 충분하지 않다면 훈련 모델을 이용하여 더욱 일반화 시키는 것이 가능하다.
  • 과적합이 방지 될 수 있다.
  • 과소적합이 방지될 수 있다.
  • 주어진 데이터셋에 학습된 알고리즘이 얼마나 잘 일반화되어있는지 평가하는데 이용할 수 있다.

하지만 반복하여 훈련시키기 때문에 모델링의 시간이 증가한다는 단점이 존재한다.

 

일반적으로 교차검증에서는 K-겹 교차검증( K-fold croos-validation)을 많이 사용한다고 하니 다음 게시글에선 이에 대해 공부해보자.

댓글