Ceci est une collection de méthodes pandas que j'utilise souvent. Je cherche à chaque fois que ce n'est pas facile à utiliser, mais c'est aussi gênant, c'est donc un article comme mémo pour moi-même. (Prévu pour être mis à jour à tout moment)
python
#Supprimer l'affichage du type flottant à 3 chiffres après le point décimal
pd.set_option('display.float_format', lambda x: '{:.3f}'.format(x))
#Même si les colonnes sont omises par défaut, toutes les colonnes seront affichées avec ce paramètre.
pd.set_option('display.max_columns', None)
python
#importation de pandas
import pandas as pd
#Définir les données, le nom de l'index, le nom de la colonne
val=[[1,2,3], [21,22,23], [31,32,33]]
index = ["row1", "row2", "row3"]
columns =["col1", "col2", "col3"]
#Créer un bloc de données en spécifiant l'index et le nom de la colonne
df = pd.DataFrame(data=val, index=index, columns=columns)
python
#fichier csv(df.csv)La première ligne est lue comme en-tête et devient automatiquement le nom de la colonne.
df = pd.read_csv("df.csv")
python
#fichier csv(df.csv)Lire, les noms de colonnes sont automatiquement sérialisés
df = pd.read_csv("df.csv",header=None)
python
#Colonne.astype(Moule)でstrMouleに変更
df["A"] = df["A"].astype(str)
python
#Colonne.apply(une fonction)で指定した列の全てのデータにune fonctionを適用する
#Ici, appliquez la fonction round
df["A"] = df["A"].apply(round)
#Colonne.apply(Fonction anonyme)Appliquer la fonction à toutes les données de la colonne spécifiée dans
#Ici, la fonction de fractionnement supprime les chaînes de caractères après la virgule dans toutes les données de la colonne A.
df["A"] = df["A"].apply(lambda x: x.split(",")[0])
python
#Combinez les trames de données d1 et d2 verticalement
df3 = pd.concat([df1,df2]).reset_index(drop=True)
#Combinez les trames de données d1 et d2 horizontalement
df3 = pd.concat([df1,df2],axis=1).reset_index(drop=True)
python
#Colonne.transform(une fonction)で指定した列の全てのデータにune fonctionを適用する
#Pour chaque groupe de la colonne A, remplissez les valeurs manquantes de la colonne B avec la valeur médiane de A dans le groupe
df["B"] = df.groupby("A")["B"].transform(lambda x: x.fillna(x.median()))
python
#Stocker le nom de la colonne contenant des données nulles dans la liste
null_col = df.isnull().sum()[df.isnull().sum()>0].index.tolist()
python
#type d'objet nom de colonne ob_Stocker sous forme de liste dans col
ob_col = df.dtypes[df.dtypes=="object"].index.tolist()
pandas a beaucoup de méthodes utiles et j'ai trop à écrire, mais je vais le mettre à jour petit à petit.