Principes de base de Pandas pour les débutants ② Présentation des données de saisie

Qu'est-ce que les pandas

Un objet de bloc de données pour gérer des données structurées en Python. Vous pouvez facilement lire des fichiers et effectuer des opérations SQL par la suite, et il est nécessaire pour des travaux tels que l'apprentissage automatique de traiter, calculer et visualiser les données. Une liste de mémos de syntaxes fréquemment utilisées pour la manipulation de données. Cette section est un aperçu des données.

Importation de bibliothèque

Importer des pandas avec le nom pd

python


import pandas as pd

Vérifiez le nombre de données

Vérifiez le nombre de "dataflame".

python


print(len(dataflame))

Confirmation du type de données

python


dataflame.dtypes

Affichage des statistiques (données numériques)

python


dataflame.describe

Compte agrégé (nombre de données), moyenne (moyenne), std (écart type), min (minimum), 25% etc. (valeur du quart), max (maximum).

Affichage des statistiques (données catégorielles)

python


dataflame.describe(include='O')

C'est o, pas zéro. Nombre agrégé (nombre de données), unique (nombre de données uniques), top (valeur de l'élément le plus fréquent), freq (nombre d'éléments). Si vous souhaitez l'afficher avec la valeur numérique, utilisez "describe (include = 'all')".

Confirmation des valeurs manquantes

Vérifiez si la valeur est prise correctement après la lecture des données initiales et après la connexion.

python


dataflame.isnull().sum()

Recommended Posts

Principes de base de Pandas pour les débutants ② Présentation des données de saisie
Vue d'ensemble de Docker (pour les débutants)
Principes de base de Pandas pour les débutants ① Lecture et traitement
[À voir pour les débutants] Bases de Linux
Lien récapitulatif des bases de Pandas pour les débutants
Principes de base de Pandas pour les débutants ④ Gestion des éléments de date et d'heure
Bases de Seaborn pour les débutants ① Graphique agrégé du nombre de données (Countplot)
Les bases de Pandas pour les débutants ③ Créez un histogramme avec matplotlib
[Pour les débutants] Script dans les 10 lignes (5. Rééchantillonnage des données de séries chronologiques à l'aide de pandas)
[Pandas] Principes de base du traitement des données de date à l'aide de dt
Compréhension facile de Python pour les tableaux et (pour les super débutants)
Un mémorandum de méthode souvent utilisé lors de l'analyse de données avec des pandas (pour les débutants)
Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)
Analyse des données de mesure ①-Mémorandum de montage scipy-
[Linux] Principes de base de la configuration des autorisations par chmod pour les débutants
Les bases de Seaborn pour les débutants ④ Pairplot
Pandas 100 coups pour les débutants en Python
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 2
Comment obtenir un aperçu de vos données dans Pandas
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 1
Bases de Seaborn pour les débutants ② histogramme (distplot)
Apprenez les bases de Python ① Débutants élémentaires
[Pandas] J'ai essayé d'analyser les données de ventes avec Python [Pour les débutants]
Bases de la théorie de l'information quantique: compression de données (1)
[Python] Compte-rendu de la réunion d'étude pour les débutants (7/15)
Pandas du débutant, par le débutant, pour le débutant [Python]
Exemple de traitement efficace des données avec PANDAS
Bases de la théorie de l'information quantique: compression de données (2)
[Introduction au Data Scientist] Bases de Python ♬
Meilleures pratiques pour manipuler les données avec les pandas
Pour les débutants de SageMaker - Liens matériels -
Outil pratique pour les débutants (en considération des idées)
Principes de base de la technologie de reconnaissance d'image (pour les débutants)
[Hikari-Python] Chapitre 09-01 Classes (Bases des objets)
Histoire de base de l'héritage en Python (pour les débutants)
lecture de données pandas
Bases de python ①
Analysons les données Covid-19 (Corona) en utilisant Python [Pour les débutants]
[Français] Tutoriel officiel NumPy "NumPy: les bases absolues pour les débutants"
Data Science 100 Knock ~ Bataille pour moins que les débutants part3
Data Science 100 Knock ~ Bataille pour moins que les débutants part6
Analyse des données financières par pandas et leur visualisation (2)
Exportez les données d'accès pour chaque utilisateur de Google Analytics.
[Pour les débutants] Comment étudier le test d'analyse de données Python3
Liste des bibliothèques Python pour les data scientists et les data ingénieurs
Analyse des données financières par pandas et leur visualisation (1)
Les masques sont utiles pour rechercher dans les trames de données Pandas
J'ai essayé le tutoriel MNIST de tensorflow pour les débutants.
Data Science 100 Knock ~ Bataille pour moins que les débutants part5
Data Science 100 Knock ~ Bataille pour moins que les débutants part2
Data Science 100 Knock ~ Bataille pour moins que les débutants part1
Data Science 100 Knock ~ Battle pour moins que les débutants part10
Vue d'ensemble et astuces de Seaborn avec visualisation de données statistiques
Science des données 100 coups ~ Bataille pour moins que les débutants part7
Récapitulatif des méthodes Pandas utilisées lors de l'extraction de données [Python]
Techniques pour comprendre la base des décisions d'apprentissage en profondeur
Data Science 100 Knock ~ Bataille pour moins que les débutants part4
Ensemble de données pour l'évaluation de l'algorithme de détection des réviseurs de spam
Science des données 100 coups ~ Bataille pour moins que les débutants part8