Réécrivez le nœud d'ajout d'enregistrement de SPSS Modeler avec Python.

Le nœud d'ajout d'enregistrement ajoute des données verticalement dans SPSS Modeler. Il s'agit d'un processus de traitement qui correspond à UNION ALL en SQL. Réécrivons cela avec des pandas Python.

0. données originales

Cela se fait à l'aide des deux données de capteur chronologiques suivantes. Éléments de données similaires, mais avec des noms de colonnes différents ou une seule colonne.

■ Données 1: Cond4n_e104.csv M_CD: code machine UP_TIIME: disponibilité PUISSANCE: Puissance TEMP: température ERR_CD: code d'erreur

image.png

■ Données 2: COND2n.csv Temps: disponibilité Puissance: puissance Température: température Pression: pression Disponibilité: temps de démarrage Statut: code d'état Résultat: code d'erreur

image.png

1m. Ajout de la version Record Modeler

Ajouter la donnée 2 "COND2n.csv" selon la colonne de données 1 "Cond4n_e104.csv".

image.png Tout d'abord, utilisez le nœud de filtre pour faire correspondre la colonne de données 2 au nom de colonne de données 1.

image.png

Connectez ensuite le nœud d'ajout d'enregistrement. Puisque la colonne correspondant à M_CD n'existe pas dans COND2n.csv de la donnée 2, NULL est entré. image.png

Les données 2 ont été ajoutées aux données 1 comme indiqué ci-dessous. image.png

À propos, dans le nœud d'ajout d'enregistrement, le critère de correspondance de champ par défaut est "nom", mais vous pouvez l'ajouter en fonction de la position de la colonne même si le nom est différent. De plus, si vous souhaitez ajouter une pression, etc. qui n'est incluse que dans les données 2 à ajouter, vous pouvez l'ajouter en sélectionnant «Tous les ensembles de données» dans la source d'entrée du champ. Il est également possible d'ajouter une chaîne de balise qui indique de quelles données proviennent.

1p. Ajout de la version record des pandas

Utilisez renommer et supprimer pour exécuter le processus correspondant au nœud de filtre. Utilisez renommer pour aligner le nom de la colonne avec les données 1 et drop pour supprimer les colonnes inutiles.

#Alignez la colonne de données 2 avec le nom de colonne de données 1.
df2_1=df2.rename(columns={'Time': 'UP_TIME', 'Power': 'POWER', 'Temperature': 'TEMP', 'Outcome': 'ERR_CD'})\
    .drop(['Pressure','Uptime','Status'],axis=1)
df2_1

image.png

Ensuite, le processus d'ajout d'enregistrement correspondant au noeud d'ajout d'enregistrement est exécuté. Il existe deux méthodes, append et concat. Le résultat est le même dans les deux cas. Lors de la combinaison de trois données ou plus, je pense qu'il est plus facile de comprendre comment écrire concat.

#Comment utiliser append
df1.append(df2_1)
#Comment utiliser concat
pd.concat([df1,df2_1])

image.png

2. Échantillon

L'échantillon est placé ci-dessous.

courant https://github.com/hkwd/200611Modeler2Python/raw/master/append/append.str notebook https://github.com/hkwd/200611Modeler2Python/blob/master/append/append.ipynb Les données https://raw.githubusercontent.com/hkwd/200611Modeler2Python/master/data/Cond4n_e104.csv https://raw.githubusercontent.com/hkwd/200611Modeler2Python/master/data/COND2n.csv

■ Environnement de test Modeler 18.2.2 Windows 10 64bit Python 3.7.9 pandas 1.0.5

4. Informations de référence

Noeud d'enregistrement en double https://www.ibm.com/support/knowledgecenter/ja/SS3RA7_18.2.1/modeler_mainhelp_client_ddita/clementine/distinct_settingstab.html

Recommended Posts

Réécrivez le nœud d'ajout d'enregistrement de SPSS Modeler avec Python.
Réécrire le nœud d'échantillonnage de SPSS Modeler avec Python (2): échantillonnage en couches, échantillonnage en grappes
Réécrire le nœud d'échantillonnage de SPSS Modeler avec Python ①: N premiers cas, échantillonnage aléatoire
Réécrivez le nœud de création de champ de SPSS Modeler avec Python. Extraction de caractéristiques à partir de données de capteurs de séries temporelles
Modifier les paramètres d'un nœud dans un super nœud avec le script SPSS Modeler Python
Réécrivez le nœud d'enregistrement en double de SPSS Modeler avec Python. ① Identifiez le premier article acheté. (2) Identification de l'article le plus vendu dans la catégorie de produits
Vérifier l'existence du fichier avec python
[Python3] Réécrire l'objet code de la fonction
Réécrire le nœud de filtre de SPSS Modeler avec Python
Réécrivez le nœud de reconfiguration de SPSS Modeler avec Python. Agrégation par catégorie de produits achetés
Préparer l'environnement d'exécution de Python3 avec Docker
Mathématiques Todai 2016 résolues avec Python
Calculez le nombre total de combinaisons avec python
Vérifiez la date du devoir de drapeau avec Python
Renommer la balise avec un espace de noms en lxml
Convertir le code de caractère du fichier avec Python3
[Python] Déterminez le type d'iris avec SVM
Extraire le tableau des fichiers image avec OneDrive et Python
Apprenez Nim avec Python (dès le début de l'année).
Détruire l'expression intermédiaire de la méthode sweep avec Python
Visualisez la gamme d'insertions internes et externes avec python
Calculer le coefficient de régression d'une analyse de régression simple avec python
Résumé du flux de base de l'apprentissage automatique avec Python
Bilan du premier défi du machine learning avec Keras
[Python] Comment réécrire le style de table avec python-pptx [python-pptx]
Obtenez l'état de fonctionnement de JR West avec Python
Gestion des versions de Node, Ruby et Python avec anyenv
Essayez de gratter les données COVID-19 Tokyo avec Python
J'ai essayé la "correction gamma" de l'image avec Python + OpenCV
Vers la retraite de Python2
L'histoire de la mise en œuvre du sujet Facebook Messenger Bot avec python
Unifier l'environnement de l'équipe de développement Python en commençant par Poetry
Visualisez les résultats des arbres de décision réalisés avec Python scikit-learn
Enregistrez une adresse IP globale avec python
Calculez des millions de chiffres dans la racine carrée de 2 avec python
J'ai écrit la grammaire de base de Python dans Jupyter Lab
Exécutez l'intelligence de votre propre bibliothèque python avec VScode.
J'ai évalué la stratégie de négociation du système boursier avec Python.
Touchons l'API de Netatmo Weather Station avec Python. #Python #Netatmo
Ajouter avec Python if instruction
L'histoire du rubyiste aux prises avec Python :: Dict data with pycall
[Homologie] Comptez le nombre de trous dans les données avec Python
Essayez d'automatiser le fonctionnement des périphériques réseau avec Python
Appelez l'API avec python3.
Estimer la posture du marqueur AR avec Python + OpenCV + drone
À propos des fonctionnalités de Python
Jouez avec le mécanisme de mot de passe de GitHub Webhook et Python
Le pouvoir des pandas: Python
Récupérez la source de la page à charger indéfiniment avec python.
J'ai comparé la vitesse de Hash avec Topaz, Ruby et Python
J'ai essayé de gratter le classement du calendrier de l'avent Qiita avec Python
Le 14 mars est le jour du rapport de circonférence. L'histoire du calcul du ratio de circonférence avec python
L'extraction de couleur avec Python + OpenCV a résolu le mystère du fond vert