728x90
1. 머신러닝이란?
- 기존 프로그래밍은 인간이 데이터를 살펴보고, 규칙을 만들고, 컴퓨터는 인간이 지시한 문제들만 수행해왔지만머신러닝은 데이터와 해답을 주고 컴퓨터가 스스로 답과 데이터의 규칙을 찾아 모델을 만드는 컴퓨터가 스스로 학습하는 새로운 프로그래밍 패러다임이다.
2. 그렇다면 머신러닝의 장점은 무엇일까?
- 많은 데이터를 보고 예측할 수 있다. (사람은 데이터를 볼때 많은 시간이 걸린다.)
- 새로운 데이터가 추가될 때마다 새로운 예측을 기계가 개선한다.
3. 머신러닝은 어떻게 동작할까?
- 데이터를 입력한다.
- 데이터를 분석하여 패턴과 규칙을 탐색한다.
- 찾아낸 패턴과 규칙을 가지고 의사결정 및 예측을 수행한다.
하지만 머신러닝 자체가 완전히 인간의 개입이 없는것은 아니다.
애초에 컴퓨터와 데이터간의 관계를 파악하기 위한 규칙을 인간이 정해줘야 하고(이러한 일을 모델을 설정한다고 한다.)
컴퓨터가 인지할 수 있는 데이터로 변환을 해주어야한다.(이러한 일을 특성을 추출한다고 한다.)
모델 설정
- 모델을 설정한다는 것은 데이터들이 어떠한 관계를 가질 것이라는 가설을 세워 선형모델, 트리모델 등을 선택하는 것
- 이는 대게 모델의 예측과 결과가 얼마나 잘못되었는지 정의하고, 이 잘못된 값을 줄이는 방향으로 최적화를 하는 알고리즘을 설정하는 방식으로 구성된다.
특성 추출
- 데이터 별로 어떤 특징을 가지고 있는지 찾고, 데이터를 벡터로 전환하는 작업이다.
- 일반적으로 특성을 자동으로 추출하는 기능이 없기에 어떠한 특징을 추출할지가 머신러닝 개발의 핵심이다.
- 학습에 사용하는 특성이 많아질 수록 과적합의 가능성도 높아지기에 적절하게 선택하여야 한다.
'공부 > 복습' 카테고리의 다른 글
표준화 (Standardization) , 정규화 (Normalization)란? (0) | 2022.08.08 |
---|---|
LSTM (Long Short Term Memory) 복습하기 (0) | 2022.08.08 |
도함수란 기울기란? (0) | 2022.05.03 |
단순 선형 회귀(Simple-regression) (0) | 2022.03.14 |
기준모델(baseline model)이란? (0) | 2022.03.11 |
댓글