728x90
편차란
평균과의 차이를 의미한다,평균과 데이터들의 차를 구한 값들을 서로 합하면 0이 된다.
따라서 분산을 구하기 위해 편차 자체를 더하지 않고 구한 값들 각각을 제곱해서 더하는 과정을 거친다.
즉 데이터가 평균에 가까울수록 편차는 작아지므로 분산은 작아지고, 평균과 멀리 떨어져있을수록 편차는 커지고 분산 또한 증가한다라는 의미이다.
표준편차
분산은 데이터의 퍼짐정도를 나타낸다. 그럼 분산이 있는데 왜 표준편차가 필요할까?
사실 분산에는 단점이 있다. 그것은 편차를 제곱하면서 값이 크게 증가하기 때문에 값 자체의 의미를 팔악하기가 어려운 경향이 있다.
예를 들어 편차가 5라면 우리는 5점 차이나는 구나라고 직관적으로 이해가 가능하지만 이 값을 제곱하면 25가 되는데 이 숫자가 무엇을 의미하는지 혼란스러울 수 있기 때문이다. 따라서 표준편차는 분산에 루트를 씌움으로 제곱하면서 증가했었던 값을 다시 원래 단위로
맞추는 과정이라고 보면된다.
'공부 > 새로 배운 상식들' 카테고리의 다른 글
카디널리티(cardinality)란? (0) | 2022.03.02 |
---|---|
선형 회귀란(Linear Regression)? (0) | 2022.02.09 |
평균,기대값,중앙값 등 용어정리 (0) | 2022.01.28 |
분산이란? 편차란? 표준편차란? (0) | 2022.01.27 |
QQPlot 큐큐플롯 이란? (0) | 2022.01.23 |
댓글