Que se passe-t-il lorsque vous lisez deux données dans Pandas et que vous les combinez?
--Lecture des données
import pandas as pd
sample001 = pd.read_excel("sample_excel_001.xlsx")
sample001.head()
sample002 = pd.read_excel("sample_excel_002.xlsx")
sample002.head()
Deux données ont été chargées dans la base de données (échantillon001, échantillon002). Il semble que vous puissiez combiner les deux données dans la colonne "data001".
merge_data = pd.merge(sample001, sample002, on="data001", how="left")
merge_data.head()
Il est facile de voir que "data001" est la chaîne du mot clé de jointure et "data003" est les données sample002. Je parle de "data002_x" et "data002_y". "D'où venez-vous?", N'est-ce pas? (Non, vous comprenez vraiment? La trame de données spécifiée dans le premier argument de fusion a x) Je n'aime pas la voir, donc au moins je veux être en mesure de comprendre rapidement d'où viennent les données.
L'option suffixes vous permet de spécifier une chaîne à ajouter à la fin du nouveau nom de colonne lorsque le nom de colonne est dupliqué à l'exception de la clé de jointure.
merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
merge_data_new.head()
Oh, maintenant vous pouvez facilement dire d'où proviennent les données!
J'aimerais pouvoir, mais j'aimerais pouvoir ajouter une chaîne de caractères au début au lieu de la fin. (Parce que cela peut être de type SQL)