warm up 내용과 본문 내용이 비슷하므로 웜업을 생략하고 본문으로 바로 정리하자
분산분석 ANOVA(analysis of variance)
- 서로 다른 그룹의 평균(또는 산술평균)에서 분산값을 비교하는 데 사용되는 통계공식이다.
분산의 의미에 대해서 다시 정의해보자면 "어떤 대상의 흩어짐 정도나 상태를 의미한다."
통계학에서는 편차 제곱의 평균 값으로 나타낸다. 편차의 용어가 헷갈린다면 아래 링크를 참조해서 복습하자
그렇다면 여러 그룹간 평균의 차이가 있는지를 어떻게 확인하는가?
그러기 위해선 여러 그룹들이 하나의 분포에서부터 왔으니 비교를 해볼 수 있다라는 가정을 할 수있다.
이를 위한 지표가 F-Statistic이다.
ANOVA 용어
종속 변수 : 독립 변수의 영향을 받는 것으로 설정할 수 있는 측정 항목입니다.
독립 변수 : 종속 변수에 영향을 미칠 수 있는 측정 항목입니다.
귀무 가설 (H0) : 그룹 또는 평균간에 차이가 없는 경우입니다. ANOVA 검정의 결과에 따라 귀무 가설이 수락되거나 거부됩니다.
대립 가설 (H1) : 그룹과 평균 사이에 차이가 있다는 가설이 있는 경우입니다.
인자 및 수준 : ANOVA 용어에서 독립 변수는 종속 변수에 영향을 미치는 인자라고 합니다. 수준은 실험에 사용되는 독립 변수의 서로 다른 값을 나타냅니다.
모수 인자 모델 : 일부 실험에서는 요인에 대해 이산 수준 집합만 사용합니다. 예를 들어, 모수 인자 검정에서는 약물의 세 가지 다른 용량을 검사하고 다른 용량은 고찰하지 않습니다.
변량 인자 모델 :이 모델은 독립 변수의 가능한 모든 값에서 변량 수준 값을 가져옵니다.
변수: 변할 수 있는 수
상수: 항상 정해져 있는 수
용어에 대해선
링크의 글을 참고하여 공부하였다.
'AI > 데이터 사이언스' 카테고리의 다른 글
Section 1. Week3.1 13일차 (0) | 2022.02.04 |
---|---|
Section.1 2회차 12일 회고와 Wrap up (0) | 2022.02.03 |
Section 1. Week2.2 8일차 (0) | 2022.01.27 |
귀무가설(Null Hypothesis)과 대립가설(Alternative Hypothesis) 이란? (0) | 2022.01.26 |
Section 1. 3일차 (0) | 2022.01.20 |
댓글