본문 바로가기

AI/머신러닝13

로지스틱 회귀 (Logistic Regression) 로지스틱 회귀 (Logistic Regression) 회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류(Classification)해주는 지도 학습 알고리즘이다 간단하게 왼쪽의 선형모델은 아래 위로 쭉 뻗어나가지만 오른쪽의 로지스틱 모델은 0과 1사이 값에서 그려진다. 선형 모델의 예시로는 운동을 하면 체중이 감소한다라는 예시를 들 수가 있으며, 로지스틱 모델의 경우 시험의 합격의 예시가 있다. 만약 공부한 시간이 적으면 시험에 통과 못하고, 공부한 시간이 많으면 시험에 통과한다고 가정하자. 이 경우에 선형모델을 적용해 본다면 통과 확률이 음과 양의 방향으로 뻗어 나간다. 말 그대로 ‘선’이라 나오는 상황인데 .. 2022. 2. 25.
머신러닝에서 훈련/검증/테스트 세트로 나누는 이유 일반적으로 머신러닝을 모델링하는 방법의 순서는 아래와 같다. 훈련(Train): 모델을 학습시키는데 사용하며, 기출문제를 푼다고 생각하면 된다. 검증(Validation): 모델이 잘 학습되었는지 인증는데 사용, 모의고사를 푼다 생각하면 된다 시험(Test): 모델의 일반화 성능을 평가할 때 사용한다, 수능을 푼다고 생각하면 된다. 훈련 작업과 검증작업은 좋은 모델이 나올때까지 반복작업을 하더라도 문제가 없지만 테스트 데이터를 반복적으로 사용하게 된다면 데이터 누수 문제가 발생하여 모델 성능을 잘못 평가하기 때문에 피해야한다. 2022. 2. 25.
One-hot encoding과 Ridge Regression 더보기 날짜는 의미 없으므로 앞으로 제목에 날짜를 안적기로한다. 의미가 있는건 내가 오늘 뭘 배우고 뭘 이해했는지 기록을 위한거라 생각한다. 원-핫인코딩 (One - hot encoding) 인간과 컴퓨터는 데이터를 바라보는 형태가 다르기 때문에 이를 번역(?)하는 과정이 필요하다. 컴퓨터는 모든 데이터를 숫자를 바탕으로 이해하기에 컴퓨터가 문자를 이해할 수 있는 숫자로 바꾸며 이러한 결과를 임베딩이라고 한다. 원-핫 인코딩은 수많은 데이터를 0과 한개의 1의 값으로 데이터를 구별하는 인코딩이다. 표현하고자 하는 인덱스에 1, 다른 인덱스에는 0을 부여하는 벡터 표현방식이며 이렇게 표하는 것을 원-핫 백터라고 부른다고 한다. 범주형(Catagorical) 자료를 다루기 위하여 사용한다. 범주형 자료란 ?.. 2022. 2. 24.
단순선형회귀모델, 회귀계수 ,사이킷런 기준모델(Baseline Model) 예측 모델을 구체적으로 만들기 전에 가장 간단하면서도 직관적이면서 최소한의 성능을 나타내는 기준이 되는 모델 단순 선형회귀분석이란?(Simple Linear Regression) 종속변수의 변동(변수가 평균값으로부터 다른 정도)을 하나의 독립변수의 변동으로 설명하는 것 즉 한가지의 설명변수만으로 반응변수에 대한 영향을 파악하기 위해 사용한다. 예로들면 한국인의 평균 임금 y를 예측하기위해 교육수준 x를 설명 변수로 활용한다고 가정해보자, x가 수준이 높을수록 y가 클것이라고 생각이 된다. 하지만 실제 생활에서는 성격,경력,나이 등이 영향을 줄 수도 있어 변수는 굉장히 많을 수 있다. 이러한 요소들이 설명변수인데 단순하게 교육수준 하나의 설명변수로 제대로 임금을 예측하.. 2022. 2. 22.
부트캠프에 관한 불만 새로운 섹션 시작이 되어 열심히 다시 해야지 맘먹고 시작했는데 시작부터 화가 났다. warm-up 영상이 이번 섹션에도 한글 자막도 안달린 유튜브에서 찾은 영어 영상을 띡 던져 놓은 것 그럴수도 있다? 아니 그러면 안된다 자동번역이 아직 완벽한것도 아닌데 영어를 못하는 사람들은 어쩌라고? 아니 심지어 걍 일상영어면 모르겠지만, 전문성을 나름 요구로 하는 공부이고 최소 제대 로된 자막도 안달린 영상은 어쩌란 말인가? 이게 진정 나라에서 2천만원을 지원받고 하는 교육인가 ? 그렇다고 물질적인 것을 지원해주는건 단 한 가지도 없다(교재,개발도구,문구,코랩결제 등..) 허경영 말처럼 나라에 도둑이 이렇게 많은가.. 괜히 시작하자말자 1~2주만에 몇명이 나가는게 아니였다고 느껴진다. 하지만 이 부트캠프가 희망이.. 2022. 2. 22.