Un objet de bloc de données pour gérer des données structurées en Python. Vous pouvez facilement lire des fichiers et effectuer des opérations SQL par la suite, et il est nécessaire pour des travaux tels que l'apprentissage automatique de traiter, calculer et visualiser les données. Une liste de mémos de syntaxes fréquemment utilisées pour la manipulation de données. Cette section concerne la lecture et le traitement des données.
Importer des pandas avec le nom pd
python
import pandas as pd
python
dataflame = pd.read_csv('file.csv')
Excel etc. peut être lu par la même méthode. Documentation officielle de Pandas [Input / output]
Entrez le nombre requis entre parenthèses.
python
dataflame.head(10)
L'affichage du début est "tête", et l'affichage de la fin est "queue".
Ajoutez les "colonne1" et "colonne2" existantes pour créer "colonne3".
python
dataflame['column3'] = dataflame['column1'] + dataflame['column2']
"Left Outer Join" avec "dataflame1" et "dataflame2" dans la colonne "key", et faites-le "join_dataflame".
python
join_dataflame = pd.merge(dataflame1, dataflame2, on = 'key', how = 'left')
Si vous souhaitez limiter les colonnes, ajoutez dataflame1 [['column1', 'column1']].
Vider les données avec csv.
python
dataflame.to_csv('dump_file.csv', index = false, encoding = 'utf-8', sep=",")
"Index" spécifie la présence ou l'absence d'un en-tête, "encoding" spécifie le codage et "sep" spécifie le délimiteur.
Vérifiez le nombre de "dataflame".
python
print(len(dataflame))
Recommended Posts