Remarques sur la façon d'utiliser lors de la combinaison de pandas.
Quand je combine des données avec des pandas, je ne sais toujours pas quelle méthode utiliser, donc j'ai résumé "une comparaison approximative de jointure, fusion et concat" et "usage personnel".
Comparaison API
- pandas.concat
- Contrairement à la fusion et à la jointure, vous pouvez spécifier l'axe de jointure
- Spécifiez l'axe de jointure avec axe (0: index (par défaut), 1: colonne)
- Spécifiez la méthode de jointure avec jointure (interne, externe (par défaut))
- pandas.merge
- De nombreuses options par rapport à rejoindre
- Spécifiez la colonne pour être la clé de jointure avec on
- Spécifiez la méthode de jonction avec comment (gauche, droite, externe, interne (par défaut))
- pandas.DataFrame.join
- Contrairement à merge et concat, c'est une méthode de pandas.DataFrame au lieu de pandas
- Moins d'options par rapport à la fusion
- Spécifiez la colonne pour être la clé de jointure avec on
- Spécifiez la méthode de jonction avec comment (gauche (par défaut), droite, externe, interne)
Comment utiliser personnellement
- Si vous voulez une jointure relativement simple, pandas.DataFrame.join (en gros, cela semble suffisant)
- Si vous voulez faire une jointure relativement compliquée, pandas.merge (quand cela semble difficile à rejoindre)
- Si vous souhaitez insérer des données, pandas.concat (image pour ajouter des données plutôt que rejoindre)
référence
Guide de l'utilisateur Pandas "fusionner et joindre et concaténer" (document officiel traduction japonaise)
Fusionner, joindre (critères de colonne / d'index)
Concat, merge, join-python pour rejoindre DataFrame horizontalement