Utilisons Python pour représenter la fréquence des données binaires contenues dans une trame de données dans un graphique à barres unique.

En vérifiant le contenu des données Il peut arriver que vous souhaitiez représenter la quantité de données binaires incluses dans un seul graphique à barres.

Avez-vous trouvé que c'était faux? Je n'ai pas trouvé de moyen concis de le représenter avec un seul graphique à barres, donc j'inclurai également la sortie.

Cette fois, je crée un graphique à barres qui comprend non seulement des données binaires, mais également des données à 6 valeurs.

environnement

J'ai utilisé Google Colab. La version de la bibliothèque utilisée est la suivante.

Bibliothèque version
python 3.6.9
pandas 1.1.4
seaborn 0.11.0
matplotlib 3.2.2

Importer la bibliothèque

Avant d'utiliser le module ci-dessus, importez-le.

%matplotlib inline
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt

Importation de jeux de données

Cette fois, nous utiliserons les astuces de l'ensemble de données d'entraînement inclus dans seaborn. Cet ensemble de données a Il comprend le montant total payé pour le dîner et le déjeuner, le montant des jetons inclus et le sexe de la personne qui a payé.

#Importer un bloc de données
tips = sns.load_dataset('tips')

#Vérifiez les 5 premières lignes
display(tips.head())
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4

Si vous voyez la sortie ci-dessus, l'importation est réussie.

Traitement de l'information

Créez un graphique à barres en utilisant les quatre colonnes suivantes. Pour créer un graphique, vous devez convertir des valeurs qualitatives en valeurs quantitatives.

Nom de colonne Aperçu politique
sex sexe(Male/Female) Male -> 0, Female -> 1
smoker fumeur(No/Yes) No -> 0, Yes -> 1
time L'heure du repas(Lunch/Dinner) Lunch -> 0, Dinner -> 1
size Nombre de personnes(1 ~ 6) Utiliser tel quel

Je pense qu'il y a plusieurs façons de faire ça, Elle s'est déroulée comme suit.

#Quantifier le sexe(Male1 -> 0, Female -> 1)
tips.sex = tips.sex.replace("Male", 0).replace("Female", 1)

#Quantifier le fumeur(No -> 0, Yes -> 1)
tips.smoker = tips.smoker.replace("No", 0).replace("Yes", 1)

#Quantifier le temps(Lunch -> 0, Dinner -> 1)
tips.time = tips.time.replace("Lunch", 0).replace("Dinner", 1)

#Vérifiez les 5 premières lignes
display(tips.head())
total_bill tip sex smoker day time size
0 16.99 1.01 1 0 Sun 1 2
1 10.34 1.66 0 0 Sun 1 3
2 21.01 3.50 0 0 Sun 1 3
3 23.68 3.31 0 0 Sun 1 2
4 24.59 3.61 1 0 Sun 1 4

De cette façon, vous pouvez voir qu'il a été remplacé par des 0 et des 1.

Fréquence graphique

Maintenant, le sujet principal. Définissez les noms de colonnes à inclure dans le graphique à barres sous forme d'étiquette au format liste. Ensuite, obtenez la valeur unique et le numéro de chaque colonne. Dans cet état, index est le nom de la colonne et le nom de la colonne est la valeur, donc le remplacement est en cours d'exécution.

#Définition de la liste d'étiquettes à stocker dans le graphique à barres
label = ["sex", "smoker", "time", "size"]

#Obtenez une valeur unique pour chaque étiquette
tips_ = [tips[l].value_counts() for l in label]

#Convertir en bloc de données et permuter l'index et la colonne
tips_ = pd.DataFrame(tips_).transpose()

#Afficher le graphique
tips_.plot.bar()
plt.grid()
plt.title("Frequency of values in each label")
plt.ylabel("counts")
plt.xlabel("value")
plt.show()

image.png

J'ai pu créer le graphe que je voulais trouver de cette manière.

Sommaire

J'ai créé une nouvelle trame de données en utilisant value_counts et j'ai sorti un graphique à barres de la fréquence.

Référencé

Recommended Posts

Utilisons Python pour représenter la fréquence des données binaires contenues dans une trame de données dans un graphique à barres unique.
Utilisons les données ouvertes de "Mamebus" en Python
Comment utiliser la méthode __call__ dans la classe Python
Comment compter rapidement la fréquence d'apparition des caractères à partir d'une chaîne de caractères en Python?
J'ai créé un programme en Python qui change les données de 1 minute de FX en une heure arbitraire (1 heure, etc.)
Comment déterminer l'existence d'un élément sélénium en Python
[Introduction à Python] Comment utiliser l'opérateur in dans l'instruction for?
Comment vérifier la taille de la mémoire d'un dictionnaire en Python
Comment envoyer une image visualisée des données créées en Python à Typetalk
J'ai fait un programme pour vérifier la taille d'un fichier avec Python
J'ai essayé d'afficher la valeur d'altitude du DTM dans un graphique
Différentes façons de lire la dernière ligne d'un fichier csv en Python
Comment passer le résultat de l'exécution d'une commande shell dans une liste en Python
Comment utiliser la bibliothèque C en Python
Dessiner un graphique d'une fonction quadratique en Python
Récupérer l'appelant d'une fonction en Python
Copiez la liste en Python
Résumé de l'utilisation de MNIST avec Python
Utilisez PIL en Python pour extraire uniquement les données souhaitées d'Exif
Lien vers les points de données du graphe créé par jupyterlab & matplotlib
L'histoire de la lecture des données HSPICE en Python
Changer le bloc de données des données d'achat de pandas (produit ID X) en dictionnaire
Sortie sous la forme d'un tableau python
Opérations de base sur les blocs de données écrites par des débutants au cours d'une semaine d'apprentissage de Python
Environnement enregistré pour l'analyse des données avec Python
Comment obtenir une liste de fichiers dans le même répertoire avec python
[Introduction à Python] Comment obtenir l'index des données avec l'instruction for
Utilisez Pandas pour écrire uniquement les lignes spécifiées du bloc de données dans le fichier Excel
Je souhaite utiliser une source de données python dans Re: Dash pour obtenir les résultats de la requête.
J'ai créé un graphique à barres empilées avec matplotlib de Python et ajouté une étiquette de données
Que faire si la barre de progression n'est pas affichée dans tqdm de python
Découvrez le nombre maximum de caractères dans un texte multiligne stocké dans un bloc de données
Comment vérifier en Python si l'un des éléments d'une liste est dans une autre liste
Faisons un saut dans l'industrie manufacturière en utilisant le Web en plus de Python
J'ai essayé de représenter graphiquement les packages installés en Python
Résumé des outils nécessaires pour analyser les données en Python
Comment obtenir le nombre de chiffres en Python
Je veux écrire en Python! (2) Écrivons un test
[Python] Comment utiliser la bibliothèque de création de graphes Altair
Utilisons la version Python du module API Confluence.
Ne pas être conscient du contenu des données en python
Comment utiliser le modèle appris dans Lobe en Python
Un mémorandum sur la mise en œuvre des recommandations en Python
Pour faire l'équivalent de Ruby ObjectSpace._id2ref en Python
Je veux utiliser le jeu de données R avec python
Note Python: Le mystère de l'attribution d'une variable à une variable
[C / C ++] Passez la valeur calculée en C / C ++ à une fonction python pour exécuter le processus et utilisez cette valeur en C / C ++.
Utilisez le hachage pour alléger le jugement de collision d'environ 1000 balles en Python (lié au nouveau virus corona)
Obtenir la valeur d'une clé spécifique jusqu'à l'index spécifié de la liste de dictionnaires en Python
[OCI] Script Python pour obtenir l'adresse IP d'une instance de calcul dans Cloud Shell
[Python] Programmation pour trouver le nombre de a dans une chaîne de caractères qui se répète un nombre spécifié de fois.
Ce qui semble être un modèle pour la partie d'entrée standard du pro de la concurrence en python3
J'ai créé une fonction pour découper l'image de python openCV, alors veuillez l'utiliser.
Comment représenter la distribution de la composition bactérienne à partir des données d'analyse Qiime2 dans un diagramme de moustaches
J'ai écrit un doctest dans "J'ai essayé de simuler la probabilité d'un jeu de bingo avec Python"
Comment passer le résultat de l'exécution d'une commande shell dans une liste en Python (version non bloquante)
Découvrez la largeur apparente d'une chaîne en python
Avoir le graphique d'équation de la fonction linéaire dessiné en Python
Différentes façons de calculer la similitude entre les données avec python