Naive Bayes est créé sur la base du théorème bayésien, et est basé sur la probabilité a priori et sa vraisemblance (Explication of likelihood). La probabilité postérieure est calculée et classée dans la catégorie avec la probabilité postérieure la plus élevée. Il est célèbre pour être utilisé pour juger les spams.
Extracted from 'Introduction to Machine Learning', Udacity
Ce qui précède est une prédiction naïve des baies de savoir si Sara ou Chris l'ont envoyé à partir du texte de l'e-mail `` LIFE DEAL ''. La probabilité d'envoyer chaque mail de Chris et Sara est de 50% (pré-probabilité) Chris utilise des mots à un taux d'AMOUR 10%, DEAL 80%, LIFE 10%, tandis que Sara utilise des mots à un taux d'AMOUR 30%, DEAL 20% et VIE 30%. (Possibilité)
En d'autres termes, la probabilité postérieure est Pré-probabilité x vraisemblance = post-probabilité Chris 10% × 80% × 50% = 0.04 Sara 30% × 20% × 50% = 0.03
Si vous corrigez cela, 0,04 + 0,03 = 0,07 (c'est 100%) Chris 0.04 / 0.07 = 0.57 → 57% Sara 0.03 / 0.07 = 0.43 → 43%
En d'autres termes, il y a 57% de chances que ce soit Chris, donc le résultat est que l'e-mail qui dit LIFE DEAL Il est classé comme Chris.
python
from sklearn.naive_bayes import GaussianNB
GaussianNB(priors=None)
#C'est le code par défaut, n'est-ce pas?
Puisque chaque caractéristique est considérée indépendamment et exprimée sur une dimension, la malédiction de la dimensionnalité peut être atténuée.
--Mauvais point
Par exemple, comme vous pouvez le voir dans les premières décisions d'e-mail de Chris et Sara, Naive Bayes ne regarde que la fréquence des mots, donc il ne peut pas déterminer l'ordre ou la combinaison des phrases. Par exemple, en anglais, ajouter simplement pas juste avant un verbe peut changer le sens de 180 degrés. Autrement dit, les quantités de caractéristiques sont considérées comme une quantité de caractéristiques indépendante et la corrélation entre les quantités de caractéristiques n'est pas prise en compte.
Ce qui précède est le contour de NaiveBayes pour autant que je puisse comprendre. Nous le mettrons à jour quotidiennement, donc si vous avez quelque chose à ajouter ou à corriger, nous vous serions reconnaissants de bien vouloir commenter.
Recommended Posts