D'où êtes-vous

Que se passe-t-il lorsque vous lisez deux données dans Pandas et que vous les combinez?

--Lecture des données

import pandas as pd

sample001 = pd.read_excel("sample_excel_001.xlsx")
sample001.head()
89781cb2-5d55-73df-1acf-b17f433e7b07.jpeg
sample002 = pd.read_excel("sample_excel_002.xlsx")
sample002.head()
a66b2cc7-69c6-4bf2-dc4e-5f6e304a0578.jpeg

Deux données ont été chargées dans la base de données (échantillon001, échantillon002). Il semble que vous puissiez combiner les deux données dans la colonne "data001".

merge_data = pd.merge(sample001, sample002, on="data001", how="left")
merge_data.head()
e1d8f492-631d-fa42-493e-26e091c9c4ed.jpeg Il est facile de voir que "data001" est la chaîne du mot clé de jointure et "data003" est les données sample002. Je parle de "data002_x" et "data002_y". "D'où venez-vous?", N'est-ce pas? (Non, vous comprenez vraiment? La trame de données spécifiée dans le premier argument de fusion a x) Je n'aime pas la voir, donc au moins je veux être en mesure de comprendre rapidement d'où viennent les données.

Comment donner votre nom

L'option suffixes vous permet de spécifier une chaîne à ajouter à la fin du nouveau nom de colonne lorsque le nom de colonne est dupliqué à l'exception de la clé de jointure.

merge_data_new = pd.merge(sample001, sample002, on="data001", how="left", suffixes=[".sample001", ".sample002"])
merge_data_new.head()
a9c397c7-23ce-94aa-1a10-1af997cbe426.jpeg

Oh, maintenant vous pouvez facilement dire d'où proviennent les données!

finalement

J'aimerais pouvoir, mais j'aimerais pouvoir ajouter une chaîne de caractères au début au lieu de la fin. (Parce que cela peut être de type SQL)

Recommended Posts

D'où êtes-vous
Vérifier si vous êtes un universitaire
[Note] Où avez-vous utilisé async?
Avez-vous des problèmes avec "pipenv.exceptions.ResolutionFailure"?
À propos de l'environnement de développement que vous utilisez