Section.1 2회차 12일 회고와 Wrap up

AI/데이터 사이언스

남오공 2022. 2. 3. 17:45

728x90

회고

첫째주에 비교해서 통계적인 용어가 많아서 접근하기 애매했던 주차였다.

스프린트 챌린지에서 보았던 카이제곱 개념을 문제로 풀어보니까 적용을 하기 어려웠다.

하지만 이번주는 왜 통계가 필요한지 약간 몸으로 깨닫게 된 주가 된 것 같다.

부족함을 느낀 한 주였고 문득 진짜 대학원을 가야되나 싶기도 한 주였다.

가설검정을 사용하는 이유??

- 데이터를 이용해서

중앙극한값을 이용하는이유?

- population 값이 부족할때 극복하기 위함

-표본이 많아질수록 정규분포에 수렴하기 때문에

-샘플의 표본이 정규분포 값으로 나타난다가 맞는말

-실제 모집단의 분포를 제대로 나타내지는 못한다.

Sampling을 하는 이유 ?

- 모집단의 평균을 추측하기 위해서

-우리가 가지고 있는 샘플의 한계를 극복하기 위해서

컨피던스 인터벌?

-신뢰구간(범위를 적어놔야 평균추측의 정확성이 늘어나기 때문)을 정해 가설을 기각할지 말지를 결정

이항분포 (Binomial distribution)이란 무엇인가?

- 중요한 이유: 이것 자체가 모델링을 하는 이유이기 때문에

- 다양한 현상들을 통계적으로 옮겨놓은 것임

분포는 사실상 함수 역할을 한다