Manipuler des chaînes avec un groupe pandas par

Aperçu

Vous pouvez souvent trouver des exemples d'obtention des valeurs moyennes, minimales et maximales de nombres avec des pandas. J'ai souvent créé des groupes et les ai traités, alors j'ai plutôt résumé mon mémorandum. ~~ J'ai l'impression que je vais rester coincé dans le nombre de décoctions ... ~~

Les choses nécessaires

J'utilise Jupyter Notebook pour vérifier le fonctionnement.

Traitement du contenu

Les données utilisées sont les données d'événements indésirables de JADER.


import pandas as pd
import numpy as np
reacs=pd.read_csv('reac.csv',dtype='str',encoding='shift-jisx0213')

Tout d'abord, regroupez par ** numéro d'identification ** pour que chaque cas soit unique

groupCaseNo=reacs.groupby('Numéro d'identification')

Puisqu'il est groupé par numéro d'identification, vous pouvez obtenir les clés groupées en utilisant groupes comme indiqué ci-dessous.

groupCaseNo.groups.keys()

Le traitement peut être effectué pour chaque clé en procédant comme suit. Le contenu de get_group peut être obtenu en utilisant la clé de regroupement.

for case in groupCaseNo.groups.keys():
    print(groupCaseNo.get_group(case))

Il est possible de combiner des chaînes en utilisant une fonction en utilisant ʻapply` comme indiqué ci-dessous. Les fonctions anonymes sont possibles en utilisant lambda, mais je pense que vous devrez créer une fonction distincte lorsque vous faites des choses compliquées.

def getRecordAe(data):
    return data.Numéro de série de l'événement dangereux+':'+data.Événement indésirable

groupCaseNo.apply(getRecordAe)

Recommended Posts

Manipuler des chaînes avec un groupe pandas par
Standardisez par groupe avec les pandas
Génération de fonctionnalités avec pandas group par
Créez une tranche d'âge avec les pandas
Trier par pandas
Quand to_csv avec Pandas, c'est devenu ligne par ligne
Dessinez un graphique en traitant avec Pandas groupby
Visualisez rapidement avec les pandas
Traitement des ensembles de données avec des pandas (1)
Échantillonnage bootstrap avec Pandas
Convertir 202003 en 2020-03 avec les pandas
Traitement des ensembles de données avec des pandas (2)
Fusionner les ensembles de données avec les pandas
Extraire N échantillons pour chaque groupe avec Pandas DataFrame
Manipulation des données avec les Pandas!
Mélangez les données avec les pandas
pandas Matplotlib Résumé par utilisation
Charger json imbriqué avec des pandas
Mémorandum (pseudo Vlookup par pandas)
Coller les chaînes avec Numpy
Manipulation de mongoDB avec Python-Partie 6: agrégat-
[Python] Changer de type avec les pandas
Mémo de visualisation par pandas, seaborn
Comment séparer les chaînes avec ','
Empêchez les omissions avec l'impression de pandas
Conseils de traitement des données avec Pandas