(3주차) 머신러닝 기초개념 : Classification, Regression
내일배움카드로 국비지원교육을 받고 있다. 그것도 온라인으로!
이번 주는 분류와 회귀에 대한 공부! 진짜 2년 동안 지겹도록 이론을 들어온 것들이기도 하다. 이렇게 다시한번 이론과 실습을 해보고! 넘어갈 수 있어 좋다.
머신러닝에는 지도학습과 비지도학습이 있다.
분류는 주어진 데이터를 클래스 별로 구별해 내는 과정이다. 다양한 분류 알고리즘을 통해 데이터와, 데이터 Y값을 학습시키고 모델을 생성한다.
분류 알고리즘의 종류는 다음과 같다.
- K-Nearest neighbor (KNN) : 데이터를 분류하고 새로운 데이터 포인트의 카테고리를 결정할 때 K 개의 가장 가까운 포인트를 선점하고 그중 가장 많이 선택된 포인트의 카테고리로 이 새로운 데이터를 분류하는 방법이다.
- Decision Tree(의사결정 트리) : 가장 단순한 classifier 중 하나로, decision tree와 같은 도구를 활용하여 모델을 그래프로 그리는 매우 단순한 구조로 되어 있다. 이 방식은 root에서부터 적절한 node를 선택하면서 진행하다가 최종 결정을 내리게 되는 model이다.
- Random Forest : Decision tree가 여러개 모여 Forest를 이룬 것이다.Decision tree보다 작은 Tree가 여러개 모이게 되어, 모든 트리의 결과들을 합하여 더많은 값을 최종결과로 본다.
그 외에도 나이브베이즈, SVM 등이 있다.
회귀분석은 데이터 변수들간에 함수관계를 파악하여 통계적 추론을 하는 기술이다. 회귀에서는 선형 회귀모델을 가장 많이 사용하며, 가장 기본이 되는 형태이다. 독립변수가 하나이면 단순 선형 회귀이고, 독립변수가 둘 이상이면 다중 선형 회귀라고 한다. 선형 회귀는 다음과 같은 데이터에 대한 가정을 갖는다.
- 오차항은 평균이 0이고 분산이 일정한 정규 분포를 갖는다.
- 독립변수와 종속변수는 선형 관계이다.
- 오차항은 자기 상관성이 없다.
- 데이터에 아웃라이어가 없다.
- 독립변수와 오차항은 서로 독립이다.
- 독립변수 간에서는 서로 선형적으로 독립이다.
'🤖 Education > 2023모두를위한딥러닝(Fastcampus)' 카테고리의 다른 글
[패스트캠퍼스] 딥러닝 강의 열공챌린지 학습후기 (6주차) (0) | 2023.04.19 |
---|---|
[패스트캠퍼스] 딥러닝 강의 열공챌린지 학습후기 (5주차) (0) | 2023.04.19 |
[패스트캠퍼스] 딥러닝 강의 열공챌린지 학습후기 (4주차) (0) | 2023.04.05 |
[패스트캠퍼스] 딥러닝 강의 열공챌린지 학습후기 (2주차) (0) | 2023.04.05 |
[패스트캠퍼스] 딥러닝 강의 열공챌린지 학습후기 (1주차) (2) | 2023.03.15 |