알고리즘 KNN
KNN 알고리즘 (k-nearest neighbors algorithm)
분류 알고리즘. 추천 시스템 등에도 사용될 수 있다. 머신러닝, OCR 등에 사용된다.
(OCR : 광학적 문자 인식)
- 분류할 항목이 있다.
- 가장 가까운 이웃(neighbors)을 살펴본다.
- 이웃 중에 많은 것을 참고하여 항목을 분류한다.
- KNN은 k개의 가장 가까운 이웃 데이터를 이용하여 분류와 회귀 분석을 할 수 있다.
- 분류 = 그룹으로 나누기
- 회귀(regression) = (숫자로 된) 반응을 예측하기
- 특징 추출은 (과일이나 고객과 같은) 항목을 비교 가능한 몇 개의 숫자로 만드는 일이다.
- 좋은 특징을 고르는 것은 성공적인 KNN알고리즘을 만드는 데 있어 중요하다.
reference
도서 : Hello Coding 그림으로 개념을 이해하는 알고리즘