Youtube Commentaire vidéo est également disponible.
P-026: Trouvez la date de vente la plus récente (sales_ymd) et la date de vente la plus ancienne pour chaque ID client (customer_id) dans le cadre de données de détail de réception (df_receipt), et affichez 10 données différentes.
code
df_sales_ymd = df_receipt.groupby('customer_id').agg({'sales_ymd':['max','min']}).reset_index()
df_sales_ymd.columns = ['customer_id','sales_ymd_max','sales_ymd_min']
df_sales_ymd.query('sales_ymd_max != sales_ymd_min').head(10)
customer_id | sales_ymd_max | sales_ymd_min | |
---|---|---|---|
1 | CS001114000005 | 20190731 | 20180503 |
2 | CS001115000010 | 20190405 | 20171228 |
3 | CS001205000004 | 20190625 | 20170914 |
4 | CS001205000006 | 20190224 | 20180207 |
13 | CS001214000009 | 20190902 | 20170306 |
14 | CS001214000017 | 20191006 | 20180828 |
16 | CS001214000048 | 20190929 | 20171109 |
17 | CS001214000052 | 20190617 | 20180208 |
20 | CS001215000005 | 20181021 | 20170206 |
21 | CS001215000040 | 20171022 | 20170214 |
-Utilisé lorsque vous souhaitez traiter des données avec la même valeur collectivement dans Pandas DataFrame / Series et vérifier le total ou la moyenne des données avec la même valeur.
code
df_sales_ymd.columns = ["_".join(pair) for pair in df_sales_ymd.columns]
Recommended Posts