본문 바로가기
공부/새로 배운 상식들

편차와 표준편차 정리

by 남오공 2022. 1. 28.
728x90

 

의미 없는 이미지

 

 

편차란

평균과의 차이를 의미한다,평균과 데이터들의 차를 구한 값들을 서로 합하면 0이 된다.

따라서 분산을 구하기 위해 편차 자체를 더하지 않고 구한 값들 각각을 제곱해서 더하는 과정을 거친다.

즉 데이터가 평균에 가까울수록 편차는 작아지므로 분산은 작아지고, 평균과 멀리 떨어져있을수록 편차는 커지고 분산 또한 증가한다라는 의미이다.

 

표준편차

분산은 데이터의 퍼짐정도를 나타낸다. 그럼 분산이 있는데 왜 표준편차가 필요할까? 

사실 분산에는 단점이 있다. 그것은 편차를 제곱하면서 값이 크게 증가하기 때문에 값 자체의 의미를 팔악하기가 어려운 경향이 있다.

예를 들어 편차가 5라면 우리는 5점 차이나는 구나라고 직관적으로 이해가 가능하지만 이 값을 제곱하면 25가 되는데 이 숫자가 무엇을 의미하는지 혼란스러울 수 있기 때문이다. 따라서 표준편차는 분산에 루트를 씌움으로 제곱하면서 증가했었던 값을 다시 원래 단위로

맞추는 과정이라고 보면된다. 

 

 

댓글