Comment extraire les conditions (acquérir tous les éléments du Groupe qui remplissent les conditions) pour Groupe par Groupe

Je souhaite extraire les conditions d'un groupe qui a été groupé.

Je vais vous expliquer comment obtenir tous les éléments du groupe qui satisfont les conditions du groupe par groupe en Python.

Par exemple, si vous disposez des données suivantes et que le score le plus élevé est de 80 ou plus, vous souhaitez acquérir toutes les données de cette personne.

import pandas as pd
import numpy as np

df = pd.DataFrame({"name":["Yamada","Yamada","Yamada","Suzuki","Suzuki","Hayashi"],
                   "score":[60,70,80,60,70,80]})
print(df)

#       name  score
# 0   Yamada     60
# 1   Yamada     70
# 2   Yamada     80
# 3   Suzuki     60
# 4   Suzuki     70
# 5  Hayashi     80

(Corrigé le 19/12/05) Dans un tel cas, vous pouvez écrire sur une seule ligne en utilisant `` groupby.filter```.

new_df = df.groupby('name').filter(lambda group: group['score'].max() >= 80)
print(new_df)

#       name  score
# 0   Yamada     60
# 1   Yamada     70
# 2   Yamada     80
# 5  Hayashi     80

Le contenu de `` filtre () '' est des expressions lambda liées à la condition.

À propos, avant que Qiita ne m'enseigne, j'avais l'habitude d'extraire les conditions comme suit. Vous pouvez obtenir une clé qui remplit les conditions pour chaque groupe disposant de groupby, puis joindre le bloc de données d'origine à cette clé sur la gauche. Plus précisément, le code est le suivant.

group_df = df.groupby('name').max().reset_index()
key = group_df[group_df['score'] >= 80]['name']
new_df = pd.merge(key, df, on = 'name', how = 'left')
print(new_df)

#       name  score
# 0  Hayashi     80
# 1   Yamada     60
# 2   Yamada     70
# 3   Yamada     80

J'ai été impressionné de pouvoir écrire une série de flux de jointure externe gauche sur une ligne afin de récupérer la clé qui satisfait la condition et de restaurer les informations de score qui ont été supprimées par l'opération groupby.

Recommended Posts

Comment extraire les conditions (acquérir tous les éléments du Groupe qui remplissent les conditions) pour Groupe par Groupe
[Python] Comment utiliser l'instruction for. Une méthode d'extraction en spécifiant une plage ou des conditions.
Trier les éléments d'un tableau en spécifiant des conditions
Comment créer une propriété de relations qui peuvent être prefetch_related par des conditions spécifiques
Comment tester les attributs ajoutés par add_request_method de pyramid
Comment modifier le niveau de journalisation d'Azure SDK pour Python
Comment utiliser l'apprentissage automatique pour le travail? 01_ Comprendre l'objectif de l'apprentissage automatique
Comment créer un wrapper qui préserve la signature de la fonction à envelopper
Pandas du débutant, par le débutant, pour le débutant [Python]
Comment mentionner un groupe d'utilisateurs avec une notification de mou, comment vérifier l'ID d'un groupe d'utilisateurs
Afficher tout le corps de l'e-mail du groupe de messagerie recherché par Gmail et réduit
Comment lire toutes les classes contenues dans * .py dans le répertoire spécifié par Python
[python] Comment trier par le Nth Mth élément d'un tableau multidimensionnel
Comment trouver le coefficient de la courbe approximative passant par les sommets en Python
Utilisez numpy pour supprimer des colonnes ou des lignes contenant des éléments de certaines conditions
Comment faire un Raspberry Pi qui parle les tweets d'un utilisateur spécifié
[Introduction à Python] Comment obtenir l'index des données avec l'instruction for
Comment calculer la volatilité d'une marque
[python] Comment afficher les éléments de la liste côte à côte
[python] Vérifier les éléments de la liste tous, tous
Comment utiliser MkDocs pour la première fois
Comment effacer les caractères générés par Python
Comment obtenir des éléments de type dictionnaire de Python 2.7
Comment trouver la corrélation pour les variables catégorielles
Comment éviter l'étiquette de coupure du graphique créé par le module système de tracé à l'aide de matplotlib
[Ruby] Comment remplacer uniquement une partie de la chaîne de caractères correspondant à l'expression régulière?
Convertir les informations financières de toutes les sociétés cotées des 5 dernières années en fichier CSV
Comment connaître le numéro de port du service xinetd
Comment obtenir le nombre de chiffres en Python
Comment résoudre la fonction récursive qui a résolu abc115-D
La décision de scikit-learn Comment visualiser un modèle en bois
Comment savoir quelle version de Java Maven utilise
[Blender] Comment définir dynamiquement les sélections EnumProperty
[Python] Affiche toutes les combinaisons d'éléments de la liste
[Python] Résumé de la façon de spécifier la couleur de la figure
Comment frapper le document de Magic Function (Line Magic)
Comment accéder à la variable globale du module importé
Regrouper par éléments consécutifs d'une liste en Python
Comparez comment écrire le traitement des listes par langue
[Selenium] Comment spécifier le chemin relatif de chromedriver?
Extraire uniquement les éléments qui répondent à des conditions spécifiques en Python
Comment supprimer le préfixe du nom de base de données utilisé par pytest-django
Comment vérifier si le contenu du dictionnaire est le même en Python par valeur de hachage
Comment résoudre le problème que le contenu vidéo ne peut pas être lu sur Firefox pour Linux
Comment tracer beaucoup de légendes en changeant la couleur du graphique en continu avec matplotlib
Comment trouver la somme / somme cumulée pour chaque groupe à l'aide de DataFrame dans Spark [version Python]
Comment définir des variables pouvant être utilisées dans toute l'application Django ~ Utile pour les modèles, etc. ~