Principes de base de Pandas pour les débutants ① Lecture et traitement

Qu'est-ce que les pandas

Un objet de bloc de données pour gérer des données structurées en Python. Vous pouvez facilement lire des fichiers et effectuer des opérations SQL par la suite, et il est nécessaire pour des travaux tels que l'apprentissage automatique de traiter, calculer et visualiser les données. Une liste de mémos de syntaxes fréquemment utilisées pour la manipulation de données. Cette section concerne la lecture et le traitement des données.

Importation de bibliothèque

Importer des pandas avec le nom pd

`python`


import pandas as pd

Lire le fichier

`python`


dataflame = pd.read_csv('file.csv')

Excel etc. peut être lu par la même méthode. Documentation officielle de Pandas [Input / output]

Confirmation des données

Entrez le nombre requis entre parenthèses.

`python`


dataflame.head(10)

L'affichage du début est "tête", et l'affichage de la fin est "queue".

Créer une colonne

Ajoutez les "colonne1" et "colonne2" existantes pour créer "colonne3".

`python`


dataflame['column3'] = dataflame['column1'] + dataflame['column2']

Joindre

"Left Outer Join" avec "dataflame1" et "dataflame2" dans la colonne "key", et faites-le "join_dataflame".

`python`


join_dataflame = pd.merge(dataflame1, dataflame2, on = 'key', how = 'left')

Si vous souhaitez limiter les colonnes, ajoutez dataflame1 [['column1', 'column1']].

Dump de données

Vider les données avec csv.

`python`


dataflame.to_csv('dump_file.csv', index = false, encoding = 'utf-8', sep=",")

"Index" spécifie la présence ou l'absence d'un en-tête, "encoding" spécifie le codage et "sep" spécifie le délimiteur.

Vérifiez le nombre de données

Vérifiez le nombre de "dataflame".

`python`


print(len(dataflame))

Recommended Posts

Principes de base de Pandas pour les débutants ① Lecture et traitement

Principes de base de Pandas pour les débutants ⑧ Traitement des chiffres

Lien récapitulatif des bases de Pandas pour les débutants

Principes de base de Pandas pour les débutants ② Présentation des données de saisie

Les bases de Seaborn pour les débutants ④ Pairplot

Pandas 100 coups pour les débutants en Python

Bases de Seaborn pour les débutants ② histogramme (distplot)

Notions de base sur les pandas

[À voir pour les débutants] Bases de Linux

Notions de base sur les pandas

Principes de base de Pandas pour les débutants ④ Gestion des éléments de date et d'heure

Traitement des mémos souvent utilisés dans les pandas (débutants)

Python Pandas ne convient pas au traitement par lots

[Pandas] Principes de base du traitement des données de date à l'aide de dt

100 langage de traitement knock-20 (à l'aide de pandas): lecture de données JSON

[Pour enregistrement] Mémorandum Pandas

Paramètres Spacemacs (pour les débutants)

Bases de Python ② pour déclaration

Traitement des ensembles de données avec des pandas (1)

Traitement des ensembles de données avec des pandas (2)

Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)

Principes de base de MongoDB: traitement des transactions

Lecture du fichier au format pandas

Manuel python pour les débutants

100 Language Processing Knock: Chapitre 2 Principes de base des commandes UNIX (à l'aide de pandas)

100 Language Processing Knock-30 (en utilisant des pandas): lecture des résultats de l'analyse morphologique

[Linux] Principes de base de la configuration des autorisations par chmod pour les débutants

Algorithme Dikstra pour les débutants

OpenCV pour les débutants en Python

Bases de Seaborn pour les débutants ③ Diagramme de dispersion (jointplot) * Avec histogramme

[Pour les débutants] Les bases de Python expliquées par Java Gold Part 2

[Explication pour les débutants] Introduction au traitement du pliage (expliqué dans TensorFlow)

[Explication pour les débutants] Introduction au traitement du pool (expliqué dans TensorFlow)

[Pour les débutants] Les bases de Python expliquées par Java Gold Part 1

Flux d'apprentissage pour les débutants en Python

[Pour les débutants] kaggle exercice (merucari)

Distribution Linux recommandée pour les débutants

CNN (1) pour la classification des images (pour les débutants)

Construction de l'environnement Python3 (pour les débutants)

Vue d'ensemble de Docker (pour les débutants)

Python #function 2 pour les super débutants

Grammaire de base Python pour les débutants

Python #function 1 pour les super débutants

#List Python pour les super débutants

~ Conseils pour les débutants de Python présentés avec amour par Pythonista ③ ~

[Pour les débutants de Kaggle] Titanic (LightGBM)

Mémorandum de commande Linux [pour les débutants]

Conseils de traitement des données avec Pandas

Raccourci Linux pratique (pour les débutants)

[Python] Traitement itératif (for, while)

[Pandas] J'ai essayé d'analyser les données de ventes avec Python [Pour les débutants]

Bases de Seaborn pour les débutants ① Graphique agrégé du nombre de données (Countplot)