본문 바로가기
공부/통계

T 분포란?

by 남오공 2022. 1. 26.
728x90

가설검정시에는 보통 t 분포, 카이제곱분포, f 분포가 많이 활용된다고 한다
그 중t 분포에 관하여 공부해보자

1) 왜 t *분포라는 이름을 가진 것일까??

  •  이론을 만든 사람이 논문 기재시 가명을 student라고 사용했는데 거기서 따온 T라고하며 본명은 고셋

* 분포: 어떤 수의 크고 작음을 결정할 수 있도록 도와준다

 

2) t 분포의 정의?

  • 표준정규분포와 같이 평균이 0을 중심으로 좌우가 동일한 분포를 따른다.
  • 표본의 크기가 적을 때는 표준 정규분포를 위에서 눌러 높은 것과 같은 형태를 보이지만 표본이 커지며 자유도가 증가한다면 표준정규분포와 같은 분포 형태로 변한다
  • 데이터가 연속형일 경우 사용한다.
  •  

3) t 분포를 쓰는 이유?

  • 작은 정보(평균, 표준편차 등)로 많은 정보를 알 수 있다.
  • 두 집단의 평균이 동일한지 알고자 할 때 검정통계량으로 활용된다. 

 

 

 

 

4) t 분포의 이해 예시

올해와 내년의 사과주스 맛이 같을까??

- 회사에서는 존재하는 모든 사과의 당분 분포를 보고싶어함 하지만 현실적으로 어려움

 

하나의 샘플 (나무)
샘플의 사이즈(사과 개수)

 

통계학에서는 당연하게 천개의 샘플을 가져다 사용하면 아래와 같은 그래프가 나올 것이라고 생각함

사과 쥬스의 정규 분포 그래프

 

 

천개의 샘플을 사용했다는것은 천개의 점을 찍었다는 뜻 

 

 

 

 

천개의 나무(샘플의 개수) 에서 나무당 다섯개사과(샘플의 크기)을 땃다고 가정

즉 5천개의 사과가 있음

 

그래서 한나무(한 샘플)에서 다섯개의 사과를 가지고 사과쥬스를 만들어 보니 아래와 같은 모양이 나옴

샘플의 갯수가 이미 천개이기 때문에 샘플의 사이즈를 크게 하기 힘들고 샘플사이즈가가 작은것에 집중

 

그래서 고셋(t분포를 발명한사람)이 샘플의 사이즈를 3->10-> 30 로 해봤는데

 

샘플의 사이즈가 작을때는 정규분포랑 차이가 크고 t분포에 가깝고

샘플의 사이즈가 클때는 정규분포에 가깝다는 것을 발견 

 

 

t 분포는 샘플의 사이즈가 작을때 정확성을 맞추기 좋다라고 받아들이자

단점은 샘플의 사이즈의 정보가 필요하단 것 

 

 

 

 

'공부 > 통계' 카테고리의 다른 글

이산형 확률분포의 종류(베르누이,이항분포,기하분포,포아송 ...)  (0) 2022.04.26
분산과 편향?  (0) 2022.02.24
통계 분석이란?  (0) 2022.02.22
카이스퀘어 분포란?  (0) 2022.01.26

댓글