Comment manipuler les données dans Pandas, ce qui est indispensable pour gérer l'analyse des données en Python J'ai résumé les bases.
À partir de grammaires importantes que vous oubliez, nous avons inclus quelques conseils.
Recommandé pour les personnes comme celle-ci → Je veux toucher Pandas pour la première fois! → Essayez également d'utiliser R en Python. → Je ne me souviens plus de la grammaire de Pandas - ce serait pratique s'il y avait une liste quelque part ... → Combien de traitement de données peut-on faire avec Python en premier lieu?
Si vous voulez en savoir plus sur la manipulation des données, veuillez commencer par la première moitié.
◆ Résumé de base des opérations de données avec Python Pandas - Premier semestre: création et opérations de données http://qiita.com/hik0107/items/d991cc44c2d1778bb82e
Rechercher des statistiques pour chaque ligne ou colonne d'un bloc de données
math.py
#Total direction de la colonne
df_sample["score1"].sum(axis=0) #Calculer la somme des valeurs Score1
#axis=0 signifie faire la somme dans la direction verticale. Comme il est 0 par défaut, il peut être omis.
df_sample[["score1","score2"]].sum(axis=0) #score1,Additionnez chaque score 2. Deux résultats sont affichés
#Total direction ligne
df_sample[["score1","score2"]].sum(axis=1)
#Additionnez les valeurs score1 et score2 dans chaque ligne. Les résultats sont affichés pour chaque nombre de colonnes
#axis=1 signifie faire la somme dans la direction horizontale. Dans Pandas, l'Axe est dans la direction de la Ligne. "
N'oubliez pas que vous faites souvent la distinction entre les directions des colonnes.
◆Pivoting Tableau croisé et conversion de structure de données de type tableau croisé dynamique
pivot.py
df_sample.pivot_table("score1", #Spécifiez les variables à agréger
aggfunc="sum", #Spécifier comment agréger
fill_value=0, #Spécification de la valeur de remplissage en l'absence de valeur correspondante
rows="class", #Spécification des variables à laisser dans le sens des lignes
columns="day_no") #Spécification des variables à développer dans le sens de la colonne
groupby.py
#Chez Pandas, l'exploitation de Groupby et l'agrégation qui l'accompagne sont effectuées séparément.
#Si vous utilisez la méthode groupby, cela ressemble à un bloc de données normal, mais Group_Un objet avec les informations clés de By est généré.
#Cela s'applique également à R. Regrouper par dans Dplyr()Une clé est définie par et Summarize agrège en fonction de la clé.
df_sample_grouped = df_sample.groupby("day_no") # day_Groupe sans_Faites par.
df_sample_grouped[["score1","score2"]].sum()
#Somme pour les objets groupés.
#Si vous le souhaitez, vous pouvez spécifier une variable pour effectuer la somme.
# Group_By Key est traité de force comme Index
#Par conséquent, Group_Ne peut pas être traité comme une variable de colonne comme avant par
df_sample_grouped = df_sample.groupby("day_no", as_index=false)
# as_index=Si false est spécifié, il cessera d'être traité comme un index.
Créer DF à partir du fichier csv ou exporter DF vers csv
file.py
#Importer des données csv
pd.read_csv("path_of_data")
#Exporter les données csv
pd.to_csv("path_of_exported_file")