공분1 Section 1. Week3.2 14일차 지금까지 강의들을 보며 확률변수가 있을때 분포를 나타낼 때 보통 사용하는 것이 보통 분산이다. 계속 복습하지만 분산은 각 값들의 평균으로부터 차이의 제곱을 합한 값의 평균이다. 즉 분산을 구하기 위해서는 일반적으로 평균을 계산하여야 한다. 분산을 사용하며 자료의 분포도가 얼마나 퍼져있는지을 알게 되었다. 분산은 하나의 확률변수의 퍼짐을 파악하기 위해서 이용했던 것이고 여러개의 확률변수들이 어떻게 퍼져있는지를 나태내기 위해선 공분산을 이용한다. Covariance(공분산) 이는 두개의 변수가 어떠한 연관성을 나타내며 변하는지 측정하기 위해서 사용한다. 하나가 증가할 때, 다른 하나도 증가하는 경향을 파악하기 위한 것으로 생각하자 공분산또한 데이터의 스케일(분산에서의 제곱에 의한 데이터 크기 변화) 에 .. 2022. 2. 7. 이전 1 다음