Visualisation des données avec les pandas

Il existe déjà un article précédent, mais pandas a une fonction de visualisation des données. C'est un wrapper fin pour matplotlib, mais il casse un peu le code graphique de base.

Visualisation des données à l'aide de Pandas

Avec la visualisation de l'iris introduite ici, il peut être visualisé avec la même quantité de code que R.

Python for R Users [Différences entre Python et R (visualisation de données / création de graphes)](http://pythondatascience.plavox.info/python%E3%81%A8r%E3%81%AE%E9%81%95%E3%81% 84 /% E3% 83% 87% E3% 83% BC% E3% 82% BF% E5% 8F% AF% E8% A6% 96% E5% 8C% 96% E3% 83% BB% E3% 82% B0 % E3% 83% A9% E3% 83% 95% E4% BD% 9C% E6% 88% 90 /)

La plupart des importations sont des spécifications python, mais je pense que la productivité actuelle de l'analyse des données avec python est assez élevée. R studio / dplyr est devenu populaire dans R, et la productivité s'est améliorée, mais je pense que python a changé depuis 5 ans avec Jupyter / Pandas devenant populaire. (C'est complètement différent de quand numpy + matplotlib était le principal.)

Paquets requis, chargement des données

import seaborn as sns
import pandas as pd
iris=sns.load_dataset("iris")
%%matplotlib inline

Importez seaborn pour le rendre à la mode. De plus, seaborn contient également des données sur les jouets, de sorte que l'iris peut être chargé à partir d'ici.

Nuage de points

iris.plot.scatter(x="sepal_length",y="sepal_width")

scatter.png

Boîte à moustaches

iris.sepal_length.plot.box()

box.png

histogramme

iris.sepal_length.hist()

hist.png

Graphique en ligne

iris.sepal_length.plot.line()

line.png

Diagramme circulaire

pd.crosstab(iris.species,columns="species").plot.pie(y="species")

pie.png

Cela présente certains défis par défaut.

Il est subtil de modifier les paramètres à cet effet, mais si vous ajoutez des paramètres, tout ira bien.

from matplotlib import pylab
default_size=pylab.rcParams["figure.figsize"]
pylab.rcParams["figure.figsize"]=12,12
pd.crosstab(iris.species,columns="species").plot.pie(y="species",colors=sns.color_palette())

pie2.png

Si vous modifiez la taille, remettez-la en place.

pylab.rcParams["figure.figsize"]=default_size

Diagramme à bandes

iris.sepal_length.plot.bar()

bar.png

Étant donné que le graphique à barres suppose des variables catégorielles, il n'a pas éclairci les étiquettes des axes par défaut.

Si vous appelez directement matplotlib, il sera éclairci. (Depuis que seaborn a été importé, la couleur est seaborn.)

from matplotlib import pyplot as plt
plt.bar(iris.index,iris.sepal_length)

bar2.png

Résumé

La diapositive originale explique Pandas dans la première moitié, mais la visualisation dans la seconde moitié n'utilise pas de Pandas, le code est donc redondant. Si vous voulez faire des choses compliquées, vous devez contacter directement l'API de matplotlib, S'il s'agit d'un diagramme de base, il peut être codé simplement avec l'API Pandas.

Recommended Posts

Visualisation des données avec les pandas
Manipulation des données avec les Pandas!
Mélangez les données avec les pandas
Implémentez "Data Visualization Design # 3" avec pandas et matplotlib
Conseils de traitement des données avec Pandas
Méthode de visualisation de données utilisant matplotlib (+ pandas) (5)
Traçage de données polyvalent avec pandas + matplotlib
Méthode de visualisation de données utilisant matplotlib (+ pandas) (3)
Visualisez facilement vos données avec Python seaborn.
Analyse de données à partir de python (visualisation de données 1)
Méthode de visualisation de données utilisant matplotlib (+ pandas) (4)
Analyse de données à partir de python (visualisation de données 2)
Implémentez "Data Visualization Design # 2" avec matplotlib
lecture de données pandas
Essayez de convertir en données ordonnées avec les pandas
Recommandation d'Altair! Visualisation des données avec Python
Gérez les structures de données 3D avec les pandas
Exemple de traitement efficace des données avec PANDAS
Meilleures pratiques pour manipuler les données avec les pandas
Analyse de données avec python 2
Visualisez rapidement avec les pandas
Essayez d'agréger les données de musique doujin avec des pandas
Traitement des ensembles de données avec des pandas (1)
Échantillonnage bootstrap avec Pandas
Convertir 202003 en 2020-03 avec les pandas
Traitement des ensembles de données avec des pandas (2)
Bibliothèques de visualisation de données Python
Fusionner les ensembles de données avec les pandas
Lecture de données avec TensorFlow
Augmentation des données avec openCV
Transformez les données de vacances en une trame de données avec les pandas
Normariser les données avec Scipy
Analyse de données avec Python
Visualisation de la logistique avec Python
CHARGER DES DONNÉES avec PyMysql
Analyse des données financières par pandas et leur visualisation (2)
Comment convertir des données détenues horizontalement en données détenues verticalement avec des pandas
Soyez prudent lors de la lecture de données avec des pandas (spécifiez dtype)
Construction d'un environnement d'analyse de données avec Python (notebook IPython + Pandas)
Vue d'ensemble et astuces de Seaborn avec visualisation de données statistiques
Comment extraire des données qui ne manquent pas de valeur nan avec des pandas
Traiter les données csv avec python (traitement du comptage à l'aide de pandas)
Comment extraire des données qui ne manquent pas de valeur nan avec des pandas
Exemple de données créées avec python
Incorporer des données audio avec Jupyter
Graphique des données Excel avec matplotlib (1)
Charger json imbriqué avec des pandas
Génération artificielle de données avec numpy
Extraire les données Twitter avec CSV
Obtenez des données Youtube avec python
Apprenez de nouvelles données avec PaintsChainer
Visualisation des données par préfecture
Binariser les données photo avec OpenCV
[Python] Changer de type avec les pandas
Graphique des données Excel avec matplotlib (2)
Application Python: visualisation de données, partie 2: matplotlib
Utilisez Django pour enregistrer les données de tweet
Standardisez par groupe avec les pandas
Méthode de visualisation de données utilisant matplotlib (2)