introduction

Je laisserai un mot car j'oublierai bientôt le fonctionnement des Pandas. Veuillez noter qu'il y a un biais dans la description car c'est un style à ajouter de plus en plus à ceux que j'ai recherchés pour fonctionner.

On suppose qu'il a été importé comme indiqué ci-dessous.

import pandas as pd

Système d'affichage

Évitez les omissions de colonne dans le notebook Jupyter

Définissez la valeur de max_columns sur une valeur élevée

pd.set_option('display.max_columns', 100)

Opération de fichier liée

Importer csv


data = pd.read_csv('filename.csv', parse_dates=['timestamp'])

Peut être lu comme type datetime avec parse_dates

Exporter vers csv


data = pd.to_csv('filename.csv', index=False, sep='\t')
# index:Présence / absence d'affichage
# sep:Spécification du séparateur

Manipuler les valeurs

Fonctionnement avec le même numéro de série tant que la même valeur continue

df = pd.DataFrame(['a', 'a', 'b', 'b', 'c','c','c', 'd', 'e'])
df['idx'],_ = pd.factorize(df[0])
print(df)
   0  idx
0  a    0
1  a    0
2  b    1
3  b    1
4  c    2
5  c    2
6  c    2
7  d    3
8  e    4

Accès aux données multi-index

diff_df.loc['A', 'B'] # A=level1 B=level2

Joindre entre les tables

Spécifiez la clé avec l'argument on. Sélectionnez la méthode de jonction avec comment.

pd.merge(a, b, on=['first_key', 'second_key'], how='left')

[Astuces] Ma note Pandas