Bases de Seaborn pour les débutants ① Graphique agrégé du nombre de données (Countplot)

Qu'est-ce que Seaborn

Une bibliothèque pour dessiner des graphiques Python. .. Positionné comme une fonction wrapper (programme inclus) de matplotlib, qui est la libra la plus connue. En plus de pouvoir facilement dessiner de beaux graphiques, il dispose également d'un certain nombre de fonctions telles que le traitement par lots. Matplotlib est destiné aux spécifications et aux dessins détaillés, et seaborn est conçu pour être facile et beau.

Préparation

Tout d'abord, installez la bibliothèque seaborn avec pip. Pour pip?, Cliquez ici ('https://qiita.com/Yanagawa_Yoshihisa/items/35e6f70a8411277282ce').

Importez la bibliothèque. Nommez seaborn`` sns et ʻimport`.

python


import seaborn as sns

J'essaierai l'exemple avec les données du Titanic. Si vous ne connaissez pas Titanic, veuillez cocher "kaggle Titanic". Créez une trame de données avec des pandas.

python


dataframe = pd.read_csv('train.csv')

Nombre de données (Countplot)

Il s'agit de la visualisation agrégée du nombre de données les plus élémentaires. Utilisez Count plot pour cela. Fondamentalement, l'axe Y est le nombre d'observations, spécifiez donc uniquement l'axe X. À titre d'exemple, dessinez la relation entre la classe P (qualité de la chambre) et le nombre de cas. Spécifiez P class pour l'axe X x et data frame pour les données d'origine data.

python


sns.countplot(x="Pclass", data=dataframe)

image.png Si vous spécifiez l'axe Y, il se couchera.

python


sns.countplot(y="Pclass", data=dataframe)

image.png

Si vous souhaitez ajouter une série, ajoutez hue. (À titre d'exemple, ajoutez Sex à hue.)

python


sns.countplot(y="Pclass", data=dataframe, hue='Sex')

image.png

Vous pouvez également modifier l'ordre et la couleur des axes, donc si vous êtes intéressé, veuillez le vérifier. De plus, la modification de l'étiquette peut être effectuée en modifiant matplotlib, qui est la source originale du wrapper, mais c'est compliqué et sera omis. Avec Count plot, les avantages peuvent ne pas être ressentis. Je pense que d'autres tracés communs '' de distplot`` pairplot`, etc. seront plus avantageux.

finalement

Comme un débutant peut le comprendre, nous avons résumé les connaissances nécessaires lors de la mise en œuvre de l'apprentissage automatique avec Python dans un simple article. La table des matières est ici, donc j'espère que vous pourrez également vous référer à d'autres articles.

Recommended Posts

Bases de Seaborn pour les débutants ① Graphique agrégé du nombre de données (Countplot)
Principes de base de Pandas pour les débutants ② Présentation des données de saisie
Les bases de Seaborn pour les débutants ④ Pairplot
Bases de Seaborn pour les débutants ② histogramme (distplot)
[À voir pour les débutants] Bases de Linux
Apprenez les bases de Python ① Débutants élémentaires
Alignez le nombre d'échantillons entre les classes de données pour l'apprentissage automatique avec Python
[Français] Tutoriel officiel NumPy "NumPy: les bases absolues pour les débutants"
J'ai essayé le tutoriel MNIST de tensorflow pour les débutants.
[Linux] Principes de base de la configuration des autorisations par chmod pour les débutants
[Pour les débutants] Quantifier la similitude des phrases avec TF-IDF
Bases de Seaborn pour les débutants ③ Diagramme de dispersion (jointplot) * Avec histogramme
[Introduction au graphique logarithmique] Prédire l'heure de fin de chaque pays à partir du graphique logarithmique des données sur le nombre d'infections ♬
[Pour les débutants] Je souhaite expliquer le nombre d’apprentissage d’une manière facile à comprendre.
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 2
[Comprendre au plus court] Principes de base de Python pour l'analyse des données
[Homologie] Comptez le nombre de trous dans les données avec Python
Obtenez le nombre d'occurrences pour chaque élément de la liste
Principes de base de Pandas pour les débutants ④ Gestion des éléments de date et d'heure
[Python] Les principales faiblesses et inconvénients de Google Colaboratory [Pour les débutants]
[Python] Introduction à la création de graphiques à l'aide de données de virus corona [Pour les débutants]
[Pour les débutants] Les bases de Python expliquées par Java Gold Part 1
10. Compter le nombre de lignes
Obtenez le nombre de chiffres
Vue d'ensemble de Docker (pour les débutants)
Calculez le nombre de changements
Composants liés du graphique
Agréger les appels quotidiens par seconde à partir des journaux du serveur Web en Python
Etudier le web scraping dans le but d'extraire des données de Filmarks # 2
Principes de base de Pandas pour les débutants ① Lecture et traitement
Obtenez le nombre de vues de Qiita
Principes de base de Pandas pour les débutants ⑧ Traitement des chiffres
3 mois de données de décalage n mois de données de décalage
Calcul du nombre d'associations de Klamer
Revue des bases de Python (FizzBuzz)
Obtenez le nombre d'abonnés Youtube
Lien récapitulatif des bases de Pandas pour les débutants
À propos de la liste de base des bases de Python
[Pour les débutants] Script dans les 10 lignes (5. Rééchantillonnage des données de séries chronologiques à l'aide de pandas)
Explication d'approche pour que les débutants soient dans le top 1,5% (0,83732) dans Kaggle Titanic_3
Graphique de l'historique du nombre de couches de deep learning et du changement de précision
Représentez graphiquement le ratio de topcoder, Codeforces et TOEIC par note (Pandas + seaborn)
[Exemple d'amélioration de Python] Quel est le site d'apprentissage recommandé pour les débutants en Python?
Représentez graphiquement l'évolution du nombre d'apparitions de mots clés par mois à l'aide de pandas
Explication d'approche pour que les débutants soient dans le top 1,5% (0,83732) dans Kaggle Titanic_1
[Pour les débutants] Pourquoi avez-vous besoin du «poids» et du «biais» du réseau neuronal?
Obtenez la clé pour la migration de la deuxième couche de données JSON avec python
Explication d'approche pour que les débutants soient dans le top 1,5% (0,83732) dans Kaggle Titanic_2
[Introduction to Data Scientist] Bases du calcul scientifique, du traitement des données et comment utiliser la bibliothèque de dessins graphiques ♬ Construction d'environnement