Ingénierie des fonctionnalités pour l'apprentissage automatique à partir du 4e Google Colaboratory - Fonctionnalités interactives

introduction

Cet article explique les fonctionnalités d'interaction. Cet article est principalement basé sur "Ingénierie de la quantité de fonctionnalités pour l'apprentissage automatique". S'il vous plaît vérifier si vous devenez.

Qu'est-ce qu'une quantité d'entités d'interaction?

Il s'agit d'une méthode de création d'une nouvelle quantité d'entités en multipliant plusieurs quantités d'entités. Parmi celles-ci, la combinaison des deux fonctionnalités est appelée ** fonctionnalités d'interaction par paires **. Si la quantité de caractéristiques est binaire, ce sera un produit logique. Par exemple, lorsqu'il existe des régions et des groupes d'âge comme quantités caractéristiques, en multipliant les régions et les groupes d'âge, il est possible d'obtenir des informations qui peuvent mieux exprimer la variable objective «20 ans vivant à Tokyo» à partir des informations «20 ans» et «vivant à Tokyo». Vous pouvez le créer.

Cependant, les inconvénients sont que le coût d'apprentissage augmente et que des fonctionnalités inutiles sont créées. Cette augmentation du coût d'apprentissage et le problème des quantités de caractéristiques inutiles peuvent être résolus en effectuant une sélection de quantité de caractéristiques.

Par exemple, supposons que vous disposiez des données d'objet suivantes.

image.png

Lorsque la quantité d'entités d'interaction a été créée pour ces données, l'ensemble de données suivant a été créé.

image.png

Vous trouverez ci-dessous un exemple de code qui implémente réellement les fonctionnalités d'interaction.

import numpy as np
import pandas as pd
import sklearn.preprocessing as preproc

##Nombre aléatoire fixe
np.random.seed(100)

data_array1 = []
for i in range(1, 100):
  s = np.random.randint(0, i * 10, 10)
  data_array1.extend(s)


##Nombre aléatoire fixe
np.random.seed(20)

data_array2 = []
for i in range(1, 100):
  s = np.random.randint(0, i * 10, 10)
  data_array2.extend(s)

data = pd.DataFrame({'A': data_array1, 'B': data_array2})

##Montant de la fonction d'interaction
data2 = pd.DataFrame(preproc.PolynomialFeatures(include_bias=False).fit_transform(data))
## interaction_only=En le définissant sur True, vous pouvez exclure le carré de votre propre valeur.
# data2 = preproc.PolynomialFeatures(include_bias=False, interaction_only=True).fit_transform(data)

finalement

Je pense publier une vidéo sur l'informatique sur YouTube. Veuillez aimer, vous abonner à la chaîne et nous donner une note élevée, car cela vous motivera à mettre à jour Youtube et Qiita. YouTube: https://www.youtube.com/channel/UCywlrxt0nEdJGYtDBPW-peg Twitter: https://twitter.com/tatelabo

Recommended Posts

Ingénierie des fonctionnalités pour l'apprentissage automatique à partir du 4e Google Colaboratory - Fonctionnalités interactives
Ingénierie des fonctionnalités pour l'apprentissage automatique à partir de la partie 3 Échelle collaborative de Google
Unité 5 Ingénierie des fonctionnalités pour la sélection des fonctionnalités d'apprentissage automatique
Détection des fonctionnalités OpenCV avec Google Colaboratory
[Shakyo] Rencontre avec Python pour l'apprentissage automatique
Apprentissage automatique avec Pytorch sur Google Colab
Personnalisez l'affichage de la progression pendant l'apprentissage avec tf.keras (contre-mesures de débordement de cellules Google Colaboratory)
Alignez le nombre d'échantillons entre les classes de données pour l'apprentissage automatique avec Python
Apprentissage automatique à partir de Python Personal Memorandum Part2
Apprentissage automatique à partir de 0 pour les étudiants en physique théorique # 1
Apprentissage automatique à partir de Python Personal Memorandum Part1
[Python] Collectez des images avec Icrawler pour l'apprentissage automatique [1000 feuilles]
Apprentissage automatique à partir de zéro (apprentissage automatique appris avec Kaggle)
Apprentissage automatique à partir de 0 pour les étudiants en physique théorique # 2
La première étape de l'apprentissage automatique ~ Pour ceux qui veulent essayer l'implémentation avec python ~
[Python] Enregistrez le PDF de Google Colaboratory sur Google Drive! -Collectons des données pour l'apprentissage automatique
Notes d'apprentissage pour la fonction migrations dans le framework Django (2)
Prédire le sexe des utilisateurs de Twitter grâce à l'apprentissage automatique
Notes d'apprentissage pour la fonction migrations dans le framework Django (3)
Ingénierie des fonctionnalités des prévisions financières: quelles sont les fonctionnalités des prévisions financières?
Notes d'apprentissage pour la fonction migrations dans le framework Django (1)
Résumé du flux de base de l'apprentissage automatique avec Python
Bilan du premier défi du machine learning avec Keras
Apprenez facilement 100 traitements linguistiques Knock 2020 avec "Google Colaboratory"
Pour ceux qui souhaitent démarrer l'apprentissage automatique avec TensorFlow2
Pour vous qui regardez soudainement le journal tout en apprenant avec l'apprentissage automatique ~ Entraînement musculaire avec LightGBM ~