본문 바로가기

공부/통계5

이산형 확률분포의 종류(베르누이,이항분포,기하분포,포아송 ...) 이산형 확률 분포(Discrete probability distribution)란? 확률 변수가 특정한 값을 가질 확률을 나타내는 함수 중 값의 개수가 가산 할 수 있는 분포를 말한다. 여기서 가산이라 함은 벌어지는 사건의 확률이 유한하거나 점으로 표현이 가능한 경우를 말한다. 즉 확률변수가 취할 수 있는 실수 값의 수를 셀 수 있는 변수를 말한다 예로 동전 던지기, 주사위 던지기 등이 있다. 베르누이 확률분포, 이항분포, 기하분포, 포아송분포 등이 있으며 각 분포의 설명은 아래와 같다 베르누이 분포(Bernoulli Distribution)란? 매 사건의 시행때 마다 오직 결과 값이 2개만 존재하는 경우의 확률변수 이항 분포란? 연속된 n번의 독립적 시행에서 각 시행의 확률을 가질 때의 이산 확률 분포.. 2022. 4. 26.
분산과 편향? 데이터를 토대로 정답을 하나 맞추기 위해서 컴퓨터가 여러 번의 예측값을 내놓는데 이러한 동태를 묘사하는 표현이 편향과 분산이다. 머신러닝에서 편향과 분산은 모델의 loss나 error를 의미하기에 정리를 하고 넘어가려 한다. 편향 편향(bias)의 사전적의미로는 한쪽으로의 치우침이다. 인공지능을 다루는 분야에서 무슨 편향이 있냐 생각이 들 수 있지만 인공지능을 위해 제공하는 데이터의 주체가 인간이기에 어쩔 수 없이 인공지능에서도 편향이 나타나게 된다. 분산 어떤 대상의 흩어진 정도나 상태를 의미한다. 편차들의 제곱한 값의 평균이다. 위의 사진에서 빨간 중간 과녁은 사람이 컴퓨터에게 정해놓은 정답(target)이며 파란 점들은 컴퓨터가 예측한 값(추정값)이다. 여기서 편향(bias)는 target과 추정 .. 2022. 2. 24.
통계 분석이란? 정의: 특정한 집단이나 불확실한 현상에 대한 자료를 수집하여 인사이트를 내는 과정 통계적 추론? - 수집된 자료를 이용해 모집단에 대한 의사결정을 하는 것 - 모수추정 - 가설검정 - 예측 2022. 2. 22.
카이스퀘어 분포란? 카이스퀘어의 뜻은? 그리스어로 x의 이름이 카이라고 부른다고 한다. 큰 의미는 없음 그래서 x의 제곱이라 카이스퀘어라고 부르는것 일반적으로 어떤 확률변수 x(ex.몸무게 키)가 있다고 생각해보자 일반적으로 이는 정규분포를 따른다. 그렇다면 이를 제곱하면 무슨 분포를 따르까? 라는 질문에서 나온것이 카이스퀘어 분산의 분포를 카이스퀘어라고 한다 자유도와 카이스퀘어가 비슷할때 정규화를 따른 다 라고 본다. 표준정규 분포 m =0 분산이 = 1 이라고 가정하자 단위를 안다는 것은 분포를 안다는 것 일반적으로 저러한 모양을 띈다는데 아직까진 이해가 안된다. 유튜버:asdf오터의통계 참고 2022. 1. 26.
T 분포란? 가설검정시에는 보통 t 분포, 카이제곱분포, f 분포가 많이 활용된다고 한다 그 중t 분포에 관하여 공부해보자 1) 왜 t *분포라는 이름을 가진 것일까?? 이론을 만든 사람이 논문 기재시 가명을 student라고 사용했는데 거기서 따온 T라고하며 본명은 고셋 * 분포: 어떤 수의 크고 작음을 결정할 수 있도록 도와준다 2) t 분포의 정의? 표준정규분포와 같이 평균이 0을 중심으로 좌우가 동일한 분포를 따른다. 표본의 크기가 적을 때는 표준 정규분포를 위에서 눌러 높은 것과 같은 형태를 보이지만 표본이 커지며 자유도가 증가한다면 표준정규분포와 같은 분포 형태로 변한다 데이터가 연속형일 경우 사용한다. 3) t 분포를 쓰는 이유? 작은 정보(평균, 표준편차 등)로 많은 정보를 알 수 있다. 두 집단의 평.. 2022. 1. 26.