본문 바로가기

공부/새로 배운 상식들12

정치 관련 홍보 전화 차단 방법 대선이 끝났는데도 매일같이 02 로 시작하는 정치 관련 전화가 온다 서울시장인지 뭔지.. 전화 좀 그만했으면.. 내 번호.. 그만 팔려.. skt -> 티월드 접속, 번호제공에서선거 관련 여론 조사 목적의 휴대폰 번호 제공 메뉴에서 거부 등록버튼 kt -> 080-999-1390 전화해서 거부 신청 lg -> 080 -855 -0016 전화해서 거부신청 2022. 4. 27.
STEEP 분석이란? STEEP이란? 사회, 기술, 경제, 환경, 정치(Society, Technology, Economy, Enviroment, Political)에 관하여 전반적인 트렌드를 파악하는 거시적 환경 분석 방법이다 거시적인 메가 트렌드에서 현재의 조직이나 해당 산업에 폭 넓게영향을 미치는 사회,경제적 요인에 관하여 기회를 탐색하기 위하여 사용된다고 보면 된다. 반대로 미시적인 환경 분석 방식으로는 3C(Customer, Competition, Company) 분석 방법이 있다. *거시적이다라는 의미는 사회의 구조적인 관점으로 객관적인 사회 조건을 본다고 생각하면 되며 *미시적이다라는 의미는 개인적인 관점으로 자율성과 상호 작용을 본다고 생각하면 된다. STEEP 분석 방법의 진행은 아래 순서로 진행되어진다. S.. 2022. 4. 23.
데이터 셋 제공 사이트 목록 [국내] AI 팩토리 : [[http://aifactory.space/]](http//aifactory.space/) 공공데이터포털 : [[https://www.data.go.kr/](https://www.data.go.kr/)] AI허브 : [[http://www.aihub.or.kr/](https//aihub.or.kr/)] 데이콘 : [[https://dacon.io/](https//dacon.io/)] 보건의료빅데이터개방시스템 : [[https://opendata.hira.or.kr/](https//opendata.hira.or.kr/home.do)] [국외] 캐글 : [[https://www.kaggle.com/datasets](https://www.kaggle.com/datasets)] 구글 .. 2022. 3. 24.
임계값(threshold)이란? 귀무가설의 검정 통계량의 분포에서 귀무가설을 기각해야 하는 값의 집합을 정의하는 점, 이것을 임계 영역 또는 기각 영역이라고 한다. 예를 들자면 얼음의 녹는점, 물이 기체로 변할때 기화하는 부분이 임계값이라고 할 수 있다. 2022. 3. 7.
회귀(Regression)와 분류(Classification)란? 더보기 매번 머신러닝을 공부할때 회귀와 분류가 나오는데 이 의미를 대략적으로만 알고 있었지 막상 나오면 어떻게 봐야할지 이해가 안가 정리하고자한다. 지도학습은 훈련데이터를 모델화하여 필요로하는 데이터데 대해 정확한 출력을 예측하는 것이 필요하다. 이때 회귀와 분류가 지도학습의 목적이라고 볼 수 있다. 회귀(Regression)? 회귀의 사전적 정의는 한바퀴 돌아 제자리로 돌아가다라는 의미이다. 하지만 우리가 말하는 데이터 분석에서의 회귀의 의미는 잔차(residual: 데이터의 실측치와 모델의 예측치의 사이의 차이 즉 회귀식에서 오차항에 대한 관측치)가 평균으로 돌아가는 것을 의미한다. 회귀는 예측하고자 하는 변수가 연속적인 숫자(Countinuous Value)일 때 이를 예측하는 것 이다. 회귀는 확.. 2022. 3. 3.
카디널리티(cardinality)란? 중복도가 ‘낮으면’ 카디널리티가 ‘높다’고 표현하고 중복도가 ‘높으면’ 카디널리티가 ‘낮다’고 표현한다. 카디널리티는 전체 행에 대한 특정 컬럼의 중복 수치를 나타내는 지표이다. 이 카디널리티는 상대적인 개념으로 접근을 해야하는데 그 중에 한 예로 학교에서 한 반이 인원이 40명이라고 한다면 같은 이름을 가질 확률은 상대적으로 적으므로 이름이란 특성은 카디널리티가 높다고 할 수 있다. 하지만 한 지역이나 나라로 보자면 같은 이름은 많기 때문에 상대적으로 카디널리티가 상당히 낮다고 볼 수 있다. 2022. 3. 2.
선형 회귀란(Linear Regression)? 선형회귀(Linear Regression)란? 변수 사이의 선형적인 관계를 모델링한 것 즉 주어진 데이터에 학습을 거쳐서 가장 합리적인 선을 찾아내는 것 근사값을 찾는 것만으로도 유의미한 인사이트를 도출 해 낼수도 있다. 2022. 2. 9.
편차와 표준편차 정리 편차란 평균과의 차이를 의미한다,평균과 데이터들의 차를 구한 값들을 서로 합하면 0이 된다. 따라서 분산을 구하기 위해 편차 자체를 더하지 않고 구한 값들 각각을 제곱해서 더하는 과정을 거친다. 즉 데이터가 평균에 가까울수록 편차는 작아지므로 분산은 작아지고, 평균과 멀리 떨어져있을수록 편차는 커지고 분산 또한 증가한다라는 의미이다. 표준편차 분산은 데이터의 퍼짐정도를 나타낸다. 그럼 분산이 있는데 왜 표준편차가 필요할까? 사실 분산에는 단점이 있다. 그것은 편차를 제곱하면서 값이 크게 증가하기 때문에 값 자체의 의미를 팔악하기가 어려운 경향이 있다. 예를 들어 편차가 5라면 우리는 5점 차이나는 구나라고 직관적으로 이해가 가능하지만 이 값을 제곱하면 25가 되는데 이 숫자가 무엇을 의미하는지 혼란스러울.. 2022. 1. 28.