Youtube Commentaire vidéo est également disponible.
P-024: Pour le bloc de données des détails du reçu (df_receipt), recherchez la dernière date de vente (sales_ymd) pour chaque ID client (customer_id) et affichez 10 articles.
code
df_receipt.groupby('customer_id').sales_ymd.max().reset_index().head(10)
customer_id | sales_ymd | |
---|---|---|
0 | CS001113000004 | 20190308 |
1 | CS001114000005 | 20190731 |
2 | CS001115000010 | 20190405 |
3 | CS001205000004 | 20190625 |
4 | CS001205000006 | 20190224 |
5 | CS001211000025 | 20190322 |
6 | CS001212000027 | 20170127 |
7 | CS001212000031 | 20180906 |
8 | CS001212000046 | 20170811 |
9 | CS001212000070 | 20191018 |
** - Utilisé lorsque vous souhaitez traiter des données avec la même valeur ensemble dans le DataFrame / Series de Pandas et vérifier le total ou la moyenne des données avec la même valeur. -'Groupby 'est utilisé lorsque vous souhaitez collecter des données avec la même valeur ou chaîne de caractères et effectuer une opération commune (totale ou moyenne) pour chaque même valeur ou chaîne de caractères.
code
df_receipt.groupby('customer_id').agg({'sales_ymd':'max'}).reset_index().head(10)
Recommended Posts