본문 바로가기
AI/데이터 사이언스

Section.1 2회차 12일 회고와 Wrap up

by 남오공 2022. 2. 3.
728x90

 

 

회고

첫째주에 비교해서 통계적인 용어가 많아서 접근하기 애매했던 주차였다.

스프린트 챌린지에서 보았던 카이제곱 개념을 문제로 풀어보니까 적용을 하기 어려웠다.

하지만 이번주는 왜 통계가 필요한지 약간 몸으로 깨닫게 된 주가 된 것 같다.

 

부족함을 느낀 한 주였고 문득 진짜 대학원을 가야되나 싶기도 한 주였다. 

 

wrap up  

 

가설검정을 사용하는 이유??

- 데이터를 이용해서 

 

중앙극한값을 이용하는이유?

- population 값이 부족할때 극복하기 위함 

-표본이 많아질수록 정규분포에 수렴하기 때문에

-샘플의 표본이 정규분포 값으로 나타난다가 맞는말

-실제 모집단의 분포를 제대로 나타내지는 못한다.

 

 

Sampling을 하는 이유 ?

- 모집단의 평균을 추측하기 위해서

-우리가 가지고 있는  샘플의 한계를 극복하기 위해서 

 

컨피던스 인터벌?

-신뢰구간(범위를 적어놔야 평균추측의 정확성이 늘어나기 때문)을 정해 가설을 기각할지 말지를 결정

-

 

이항분포 (Binomial distribution)이란 무엇인가? 

- 중요한 이유: 이것 자체가 모델링을 하는 이유이기 때문에

- 다양한 현상들을 통계적으로 옮겨놓은 것임

 

분포는 사실상 함수 역할을 한다 

 

댓글