Comprendre le mémo de la programmation collective des connaissances

Aperçu

Pour étudier les algorithmes d'apprentissage automatique Quand je lis "Programmation de connaissances de groupe" (ISBN-13: 978-4873113647) Je n'étais pas sûr de ce que faisaient les formules du programme, alors Notez ce que vous avez recherché.

~~ C'était une mathématique lourde, donc si je l'ai lu à la légère, je ne l'aurais peut-être pas suivi ... ~~

J'ai de nouveau étudié les statistiques après un long moment, alors Il peut y avoir de nombreuses erreurs. Je vous serais reconnaissant si vous pouviez le signaler.

Chapitre 6 Filtrage de documents

6.6.2 Intégrer les probabilités

――Cette section est un résumé du jugement de spam par e-mail


Algorithme ⇒ L'auteur a publié sur github. Je laisserai une note des points qui étaient difficiles à comprendre personnellement («(1)» et «(2)» et «(3)» ci-dessous).

  def fisherprob(self,item,cat):
    p=1
    features=self.getfeatures(item)
    for f in features:
      p*=(self.weightedprob(f,cat,self.cprob))
    
    # (1)・ ・ ・ Que calcule le fscore?
    fscore=-2*math.log(p)
    
    return self.invchi2(fscore,len(features)*2)

  # (2)・ ・ ・ Que calcule invchi2?
  def invchi2(self,chi, df):
    # (3)・ ・ ・ La fonction inverse peut-elle être calculée?
    m = chi / 2.0
    sum = term = math.exp(-m)
    for i in range(1, df//2):
        term *= m / i
        sum += term
    return min(sum, 1.0)

Mémo d'informations connexes

――La méthode de Fisher est-elle appelée méthode Robinson-Fisher dans les articles japonais?

Recommended Posts

Comprendre le mémo de la programmation collective des connaissances
Caractéristiques du langage de programmation [Memo]
Compréhension complète de la programmation asynchrone Python
Une compréhension approximative de python-fire et un mémo
Compréhension complète de la programmation orientée objet de Python
[Note] Début de la programmation
Recrutement de maîtres de programmation
Mémorandum elasticsearch_dsl
Compréhension intuitive de l'inégalité de Jensen
Programmation linéaire + pratique de la pulpe
Mémo Qiita de mes pensées
[Memo] Construction de l'environnement cygwin
La popularité des langages de programmation
Premier mois d'apprentissage en programmation
Compréhension complète du débogage Python