KNN 알고리즘 (k-nearest neighbors algorithm)

 

분류 알고리즘. 추천 시스템 등에도 사용될 수 있다. 머신러닝, OCR 등에 사용된다.
(OCR : 광학적 문자 인식)

  1. 분류할 항목이 있다.
  2. 가장 가까운 이웃(neighbors)을 살펴본다.
  3. 이웃 중에 많은 것을 참고하여 항목을 분류한다.

 

  • KNN은 k개의 가장 가까운 이웃 데이터를 이용하여 분류와 회귀 분석을 할 수 있다.
  • 분류 = 그룹으로 나누기
  • 회귀(regression) = (숫자로 된) 반응을 예측하기
  • 특징 추출은 (과일이나 고객과 같은) 항목을 비교 가능한 몇 개의 숫자로 만드는 일이다.
  • 좋은 특징을 고르는 것은 성공적인 KNN알고리즘을 만드는 데 있어 중요하다.

 


 

reference

도서 : Hello Coding 그림으로 개념을 이해하는 알고리즘