Principes de base de Pandas pour les débutants ① Lecture et traitement

Qu'est-ce que les pandas

Un objet de bloc de données pour gérer des données structurées en Python. Vous pouvez facilement lire des fichiers et effectuer des opérations SQL par la suite, et il est nécessaire pour des travaux tels que l'apprentissage automatique de traiter, calculer et visualiser les données. Une liste de mémos de syntaxes fréquemment utilisées pour la manipulation de données. Cette section concerne la lecture et le traitement des données.

Importation de bibliothèque

Importer des pandas avec le nom pd

python


import pandas as pd

Lire le fichier

python


dataflame = pd.read_csv('file.csv')

Excel etc. peut être lu par la même méthode. Documentation officielle de Pandas [Input / output]

Confirmation des données

Entrez le nombre requis entre parenthèses.

python


dataflame.head(10)

L'affichage du début est "tête", et l'affichage de la fin est "queue".

Créer une colonne

Ajoutez les "colonne1" et "colonne2" existantes pour créer "colonne3".

python


dataflame['column3'] = dataflame['column1'] + dataflame['column2']

Joindre

"Left Outer Join" avec "dataflame1" et "dataflame2" dans la colonne "key", et faites-le "join_dataflame".

python


join_dataflame = pd.merge(dataflame1, dataflame2, on = 'key', how = 'left')

Si vous souhaitez limiter les colonnes, ajoutez dataflame1 [['column1', 'column1']].

Dump de données

Vider les données avec csv.

python


dataflame.to_csv('dump_file.csv', index = false, encoding = 'utf-8', sep=",")

"Index" spécifie la présence ou l'absence d'un en-tête, "encoding" spécifie le codage et "sep" spécifie le délimiteur.

Vérifiez le nombre de données

Vérifiez le nombre de "dataflame".

python


print(len(dataflame))

Recommended Posts

Principes de base de Pandas pour les débutants ① Lecture et traitement
Principes de base de Pandas pour les débutants ⑧ Traitement des chiffres
Lien récapitulatif des bases de Pandas pour les débutants
Principes de base de Pandas pour les débutants ② Présentation des données de saisie
Les bases de Seaborn pour les débutants ④ Pairplot
Pandas 100 coups pour les débutants en Python
Bases de Seaborn pour les débutants ② histogramme (distplot)
Notions de base sur les pandas
[À voir pour les débutants] Bases de Linux
Notions de base sur les pandas
Principes de base de Pandas pour les débutants ④ Gestion des éléments de date et d'heure
Traitement des mémos souvent utilisés dans les pandas (débutants)
Python Pandas ne convient pas au traitement par lots
[Pandas] Principes de base du traitement des données de date à l'aide de dt
100 langage de traitement knock-20 (à l'aide de pandas): lecture de données JSON
[Pour enregistrement] Mémorandum Pandas
Paramètres Spacemacs (pour les débutants)
Bases de Python ② pour déclaration
Traitement des ensembles de données avec des pandas (1)
Traitement des ensembles de données avec des pandas (2)
Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)
Principes de base de MongoDB: traitement des transactions
Lecture du fichier au format pandas
Manuel python pour les débutants
100 Language Processing Knock: Chapitre 2 Principes de base des commandes UNIX (à l'aide de pandas)
100 Language Processing Knock-30 (en utilisant des pandas): lecture des résultats de l'analyse morphologique
[Linux] Principes de base de la configuration des autorisations par chmod pour les débutants
Algorithme Dikstra pour les débutants
OpenCV pour les débutants en Python
Bases de Seaborn pour les débutants ③ Diagramme de dispersion (jointplot) * Avec histogramme
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 2
[Explication pour les débutants] Introduction au traitement du pliage (expliqué dans TensorFlow)
[Explication pour les débutants] Introduction au traitement du pool (expliqué dans TensorFlow)
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 1
Flux d'apprentissage pour les débutants en Python
[Pour les débutants] kaggle exercice (merucari)
Distribution Linux recommandée pour les débutants
CNN (1) pour la classification des images (pour les débutants)
Construction de l'environnement Python3 (pour les débutants)
Vue d'ensemble de Docker (pour les débutants)
Python #function 2 pour les super débutants
Grammaire de base Python pour les débutants
Python #function 1 pour les super débutants
#List Python pour les super débutants
~ Conseils pour les débutants de Python présentés avec amour par Pythonista ③ ~
[Pour les débutants de Kaggle] Titanic (LightGBM)
Mémorandum de commande Linux [pour les débutants]
Conseils de traitement des données avec Pandas
Raccourci Linux pratique (pour les débutants)
[Python] Traitement itératif (for, while)
[Pandas] J'ai essayé d'analyser les données de ventes avec Python [Pour les débutants]
Bases de Seaborn pour les débutants ① Graphique agrégé du nombre de données (Countplot)