Cet article est une note personnelle lors de l'implémentation de SVM One Class avec sklearn. Les points que j'ai compris en lisant d'autres articles et les points que je veux retenir sont résumés à l'aide de chiffres.
La fonction à lire est la suivante.
Cette fois, nous définissons les éléments suivants comme des données d'entraînement, des données de test et des données aberrantes.
Les graphiques de «X_train», «X_test» et «X_outliers» sont les suivants.
Les paramètres utilisés pour l'entraînement sont affichés dans clf.get_params
Dans clf.decision_function (X_test)
, la distance de la limite de discrimination à chaque point de distribution est indiquée, et une valeur positive signifie dans la classification et une valeur négative signifie en dehors de la classification.
clf.predict (X_test)
renvoie 1 ou -1 pour voir si chaque point donné est une valeur aberrante.
Ce qui suit est un tableau de «prédire» et «fonction_décision» pour vérifier la plage de «X_outliers» donnée comme valeur aberrante.
Puisqu'il existe de nombreuses valeurs aberrantes, il existe de nombreuses données qui sont «-1», mais il y en a qui sont «1», et on peut voir qu'elles sont dans la plage de données d'apprentissage.
sample_set_1
est un ensemble de valeurs aberrantes qui se trouvaient dans la plage d'apprentissage dans l'ensemble de données des valeurs aberrantes, et sample_set_mina1
est un ensemble de valeurs aberrantes dans l'ensemble de données des valeurs aberrantes.
Les deux points qui sont OK ci-dessous sont les points «1».
Ceci est un mémo d'implémentation simple.