본문 바로가기
공부/새로 배운 상식들

분산이란? 편차란? 표준편차란?

by 남오공 2022. 1. 27.
728x90

 

 

편차란?

  • 하나의 변량이 편균으로부터 얼마나 떨어져 있는가를 나타내주는 값이다.
  • 하지만 모든 변량과 평균이 얼마나 떨어져 있는지를 나타내기를 힘들기 때문에 편차의 평균을 구할 필요가 있다.
  • 편차끼리의 합은 무조건 0이 나오므로 의미있는 결과물을 내기 위하여 편차에 제곱을 하여 평균을 구하여 분산을 구한다.

편차 = 변량 -평균

 

변량이란?

점수,시간 같은 여러 자료를 수량으로 나타낸 것을 말한다

예시로 민수라는 아이의 시험 점수가

국어 영어 수학 사회
80 90 100 70

라고 가정한다면 국영수사회 과목들이 각각 변량이다.

그렇다면 이 민수의 시험점수의 편차를 계산해보면

 

위 점수의 평균이 85점이기에 각

국어 80-85  = -5

영어 90-85   = 5

수학 100-85 = 15

사회 70-85  = -15

 

분산이란?

  • 어떤 대상의 흩어진 정도나 상태를 의미한다.
  • 편차들의 제곱한 값의 평균이다.

 

위 값들의  편차를 제곱하면

각 25, 225 ,25, 225 값이 나온다.

 

분산은 편차제곱의 평균 값이니 아래와 같이 계산하면 된다

(25+225+25+225)/4 = 125 이다.

 

분산값은 즉 125가 된다.

표준편차는 125에 루트를 씌우면 값이나온다.

 

그렇다면 표준편차는 뭘까?

  • 자료의 관찰값들이 얼마나 흩어져 있는지 그 정도를 나타내는 방법중의 하나이다. 

이렇게 보면 분산과의 무슨차이지 라고 생각이 들 수 있는데,

표준편차는 어떤 수의 크고 작음을 직관적으로 이야기 할 수있기 때문에 사용한다.

 

즉 단위를 나타나기에 적합한데 

위의 예시에서는 전체 표본을 예로들자면 민수의 학급 반의 총 평균점수가 85점이라고 가정한다면

민수의 표준편차는 5(루트5)로 편하게 5라고 부르기로 가정한다면

민수의 과목 점수들은 평균점수 85점에서 평균적으로 5(80점~90점)에서 차이가 난다는 것이다. 

 

영희의 표준편차가 3이라하면 영희는 82~88점에 점수가 분포하고 있을 것이라 생각할 수 있는것이다.

 

분산에 루트를 씌운 값이다. 

 

표준편차가 크면클수록 평균에서 멀어진다 라고 보면됨 ( 평균값은 같지만 변량값이 많이 다르다)

'공부 > 새로 배운 상식들' 카테고리의 다른 글

선형 회귀란(Linear Regression)?  (0) 2022.02.09
편차와 표준편차 정리  (0) 2022.01.28
평균,기대값,중앙값 등 용어정리  (0) 2022.01.28
QQPlot 큐큐플롯 이란?  (0) 2022.01.23
수학 식 계산 순서  (0) 2022.01.12

댓글