Un objet de bloc de données pour gérer des données structurées en Python. Vous pouvez facilement lire des fichiers et effectuer des opérations SQL par la suite, et il est nécessaire pour des travaux tels que l'apprentissage automatique de traiter, calculer et visualiser les données. Une liste de mémos de syntaxes fréquemment utilisées pour la manipulation de données. Cette section est un aperçu des données.
Importer des pandas avec le nom pd
python
import pandas as pd
Vérifiez le nombre de "dataflame".
python
print(len(dataflame))
python
dataflame.dtypes
python
dataflame.describe
Compte agrégé (nombre de données), moyenne (moyenne), std (écart type), min (minimum), 25% etc. (valeur du quart), max (maximum).
python
dataflame.describe(include='O')
C'est o, pas zéro. Nombre agrégé (nombre de données), unique (nombre de données uniques), top (valeur de l'élément le plus fréquent), freq (nombre d'éléments). Si vous souhaitez l'afficher avec la valeur numérique, utilisez "describe (include = 'all')".
Vérifiez si la valeur est prise correctement après la lecture des données initiales et après la connexion.
python
dataflame.isnull().sum()
Recommended Posts