Un mémo sur pandas.DataFrame (pd.DataFrame).
#DataFrame vide
df = pd.DataFrame(columns=[Liste des noms de colonnes])
#Obtenir à partir du fichier csv
df = pd.read_csv([Chemin du fichier])
df = pd.read_csv([Chemin du fichier], names=[Liste des noms de colonnes]) #Sans en-tête
df = pd.read_csv([Chemin du fichier], sep=',') #Lors de la spécification d'un délimiteur
df = pd.read_csv([Chemin du fichier], delim_whitespace=True) #Pour séparateur d'espace
df = pd.read_csv([Chemin du fichier], comment='#') #Lors de l'inclusion de texte de commentaire
Référence: Lire le fichier csv / tsv avec pandas (read_csv, read_table)
df = df.append([dictionnaire], ignore_index=True)
Notez que contrairement au append
dans la liste, le `df.append ()`
seul ne met pas à jour le DataFrame.
# 'a' 'b'
# 0 | 1 2
# 1 | 3 4
#Obtenir l'élément
df.loc[0,'a'] # -> 1
#Obtenir la ligne
dist(df.loc[0,:]) # -> {'a':1, 'b':2}
#Obtenir la colonne
list(df.loc[:,'a']) # -> [1, 3]
Référence: Obtenir / modifier la valeur de n'importe quelle position avec les pandas at, iat, loc, iloc
#Conditions simples
df = df[df['num']>0]
df = df[df['str']=='Yes']
df = df[df['str'].isin(['Yes', 'No'])] #Lorsqu'il y a plusieurs candidats
#Conditions liées aux chaînes de caractères (si la valeur manquante NaN est incluse)'na=False'Vers les options)
df = df[df['str'].str.startswith('Y')] #Première chaîne
df = df[df['str'].str.contains('e')] #Chaîne de caractères incluse dans
df = df[df['str'].str.endswith('s')] #Chaîne de caractères à la fin
#Conditions multiples
df = df[(df['num']>0) & (df['str']=='Yes')] #Au lieu de et&
df = df[(df['num']>0) | (df['str']=='Yes')] #Au lieu de ou|
Référence: requête pour extraire les lignes de pandas.DataFrame par condition
#Trier selon la colonne spécifiée
df = df.sort_values('a', ascending=True)
#Réindexer
df = df.reset_index(drop=True)
#Enregistrer DataFrame dans un fichier csv
df.to_csv([Chemin du fichier], index=False)
Recommended Posts