Les bases de Pandas pour les débutants ③ Créez un histogramme avec matplotlib

Qu'est-ce que les pandas

Un objet de bloc de données pour gérer des données structurées en Python. Vous pouvez facilement lire des fichiers et effectuer des opérations SQL ultérieures, ce qui est nécessaire pour le travail de traitement, de calcul et de visualisation des données par apprentissage automatique. Une liste de mémos de syntaxes fréquemment utilisées pour la manipulation de données. Cette section concerne la lecture et le traitement des données.

histogramme

L'histogramme est souvent utilisé pour la confirmation des données au stade de la préparation. Cette fois, nous utiliserons la bibliothèque matplotlib. Vous pouvez facilement créer un histogramme gênant en le faisant dans Excel. Pour les données, nous avons utilisé les données familières du Titanic.

Importation de bibliothèque et chargement de données

Nommez pandas pd et importez-le. Cette fois, matplotlib.pyplot a également été importé avec le nom plt. Utilisez des exemples de données de Titanic

python


import pandas as pd
import matplotlib.pyplot as plt
dataframe = pd.read_csv('train.csv')
dataframe.head()

Créer un histogramme

Créez un histogramme par âge (colonne "Age"). Supprimez la valeur manquante avec dropna ().

python


plt.hist(dataframe['Age'].dropna(),bins = 10, range = (0,100),color = 'Blue')
plt.show()

スクリーンショット 2020-07-09 14.29.30.png

Spécifiez les bacs (nombre de bouteilles à afficher), plage (largeur des données), clor (couleur)

Créer un histogramme (normalisation)

Normaliser pour que la somme totale soit de 1.

python


plt.hist(dataframe['Age'].dropna(),bins = 20, range = (0,100),color = 'Blue', normed = 'true')
plt.show()

スクリーンショット 2020-07-09 14.36.59.png

Ajouter un titre, etc.

Ajoutez des titres, etc. pour une visualisation facile.

python


plt.title('Age Histogram', fontsize=14)
plt.xlabel('Age', fontsize=14)
plt.grid(True) 
plt.hist(dataframe['Age'].dropna(),bins = 20, range = (0,100),color = 'Blue')
plt.show()

スクリーンショット 2020-07-09 14.57.21.png

Ajoutez .title, .xlabel, .grid.

Affichage empilé

L'affichage de répartition des hommes (hommes) et des femmes (femmes) est affiché en utilisant l'affichage empilé. Définissez respectivement malelist_m et malelist_f en préparation du tracé.

python


malelist_m = dataframe['Sex'] == 'male'
malelist_f = dataframe['Sex'] == 'female'

plt.title('Age Histogram', fontsize=14)
plt.xlabel('Age', fontsize=14)
plt.grid(True) 
plt.hist([dataframe[malelist_m]['Age'],dataframe[malelist_f]['Age']],bins = 20, range = (0,100), color = ['Blue', 'Red'], label = ['male','femal'], stacked=True)
plt.legend(loc="upper right", fontsize=14) 
plt.show()

スクリーンショット 2020-07-09 15.59.04.png

Si vous voulez en empiler plusieurs, écrivez comme hist ([X1, X2]). Définissez stacked sur True pour empiler. (Également écrit sous la forme False) Définissez la légende avec l'étiquette. Ajoutez une légende avec .legend.

Recommended Posts

Les bases de Pandas pour les débutants ③ Créez un histogramme avec matplotlib
Bases de Seaborn pour les débutants ③ Diagramme de dispersion (jointplot) * Avec histogramme
Principes de base de Pandas pour les débutants ① Lecture et traitement
Principes de base de Pandas pour les débutants ⑧ Traitement des chiffres
Bases de Seaborn pour les débutants ② histogramme (distplot)
Lien récapitulatif des bases de Pandas pour les débutants
histogramme avec matplotlib
Création WebApi avec Python (création CRUD) Pour les débutants
Principes de base de Pandas pour les débutants ② Présentation des données de saisie
Les bases de Seaborn pour les débutants ④ Pairplot
Pandas 100 coups pour les débutants en Python
Principes de base de Pandas pour les débutants ④ Gestion des éléments de date et d'heure
Traçage de données polyvalent avec pandas + matplotlib
[À voir pour les débutants] Bases de Linux
Écrire un histogramme empilé avec matplotlib
[Pandas] J'ai essayé d'analyser les données de ventes avec Python [Pour les débutants]
INSÉRER dans MySQL avec Python [Pour les débutants]
Notions de base sur les pandas
Carte thermique pour la recherche de grille avec Matplotlib
Conseils pour tracer plusieurs lignes avec des pandas
Dessinez une étiquette d'axe hiérarchique avec matplotlib + pandas
Premiers pas avec Python pour PHPer-Super Basics
[Python] Lire des images avec OpenCV (pour les débutants)
Notions de base sur les pandas
[Pour les débutants] Essayez le web scraping avec Python
Meilleures pratiques pour manipuler les données avec les pandas
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer Chapitres 11 et 12 Introduction à Pandas Matplotlib
Un mémorandum de méthode souvent utilisé lors de l'analyse de données avec des pandas (pour les débutants)
Raisonnement causal et recherche causale par Python (pour les débutants)
Lire les données csv Python avec Pandas ⇒ Graphique avec Matplotlib
Tracer la courbe ROC pour la classification binaire avec Matplotlib
Visualisons l'état de l'infection par le virus corona avec Plotly [pour les débutants]
Faire un histogramme pour le moment (matplotlib)
Résumé du tutoriel Django pour les débutants par les débutants ① (création de projet ~)
Implémentez "Data Visualization Design # 3" avec pandas et matplotlib
~ Conseils pour les débutants de Python donnés avec amour par Pythonista ① ~
Analysez les journaux d'accès Apache avec Pandas et Matplotlib
~ Conseils pour les débutants de Python donnés avec amour par Pythonista ② ~
[Introduction pour les débutants] Manipuler MySQL avec Python
Les bases de #Python (#matplotlib)
Animation avec matplotlib
Japonais avec matplotlib
Animation avec matplotlib
Faire une animation avec matplotlib
Extraire N échantillons pour chaque groupe avec Pandas DataFrame
[Pour les débutants] Script dans les 10 lignes (8. Carte graphique avec folium [2]
(Pour ceux qui ne connaissent pas Matplotlib) Conseils pour dessiner des graphiques avec Seaborn
Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)
[Linux] Principes de base de la configuration des autorisations par chmod pour les débutants
[Python] Comment créer un histogramme bidimensionnel avec Matplotlib
[Pour les débutants] Quantifier la similitude des phrases avec TF-IDF