- 나이브 베이즈 (Naive Bayes)
- 지도학습, 모델기반 분류 모형
- 나이브 베이즈는 순수하게 분류를 위한 모델
- 특성들 간의 독립을 가정하기 때문에 단순화시켜 처리하는 경우에 주로 사용되며 스팸메일 분류, 네트워크 침입 탐지, 비정상행위 탐지, 질병진단 등에 사용된다.
- 나이브 베이즈 장단점
- 장점
- 구현이 쉽고 대부분 좋은 결과를 제공
- 특성들 사이의 연관성을 고려하지 않아 계산이 간단하고 빠르다.
- 적은 크기의 훈련 데이터에서도 잘 동작한다.
- 단점
- 특성들 간의 독립을 가정하기 때문에 종속적인 자료들의 경우 정확도가 떨어진다.
- 분류모델 종류
- 카테고리 나이브 베이즈 분류 모델(CategoricalNB)
- 가우시안 나이브 베이즈 분류 모델(GausianNB)
- 연속형 특성값
- 우도 추정시 정규분포 사용
- 다중 분류
- 베르누이분포 나이브 베이즈 분류 모델(BernoulliNB)
- 다항분포 나이브 베이즈 분류 모델(MultinomialNB)