La norme pour dessiner des graphiques Python est "matplotlib", mais il a été souligné que cela semble un peu démodé et que la notation est compliquée. Par conséquent, dans cet article, je vais discuter de la façon d'utiliser "Seaborn", qui est un wrapper pour réaliser les fonctions de Matplotlib plus magnifiquement et plus facilement.
Veuillez consulter le lien ci-dessous pour plus de détails. Dans cet article, nous partirons de l'hypothèse que les données Seaborn, iris, tip et titanic dans l'article suivant ont été importées.
◆ Beau dessin graphique avec python - Utilisez seaborn pour améliorer l'analyse et la visualisation des données Partie 1 http://qiita.com/hik0107/items/3dc541158fceb3156ee0
Ici, je vais utiliser les données de pointe. Voyons comment le compte du client (total_bill) est distribué pour chaque jour. Utilisez une méthode appelée stripplot.
stripplot.py
sns.stripplot(x="day", y="total_bill", data=tips)
Même pour le même repas, le montant semble différent entre le petit-déjeuner et le dîner, j'ai donc utilisé la «teinte» que j'ai utilisée la dernière fois. Regardons le déjeuner et le dîner séparément.
stripplot.py
sns.stripplot(x="day", y="total_bill", data=tips, hue='time')
Il semble que cette boutique ne déjeune pas les samedis et dimanches. Qu'est-ce qu'un restaurant dans le quartier des bureaux? ..
Utilisez une méthode appelée boxplot.
stripplot.py
sns.boxplot(x="size", y="tip", data=tips.sort('size'))
Ici, j'ai changé la couleur de la palette graphique. La façon de le faire est comme ça
stripplot.py
flatui = ["#9b59b6", "#3498db", "#95a5a6", "#e74c3c", "#34495e", "#2ecc71"]
sns.palplot(sns.color_palette(flatui))
sns.set_palette(flatui)
Veuillez vérifier ceci pour plus de détails. http://stanford.edu/~mwaskom/software/seaborn/tutorial/color_palettes.html
Ici, je vais essayer d'utiliser les données de titanic. Une méthode appelée boxplot est utilisée pour dessiner le graphique.
barplot.py
sns.barplot(x='sex', y='survived', data=titanic, hue='class')
L'axe des x est le sexe et l'axe des y est survécu, c'est-à-dire une chaîne de données contenant des 1 et des 0 pour les survivants ou les morts. Dans ce cas, par exemple, il existe de nombreux enregistrements avec sexe = homme, le nombre utilisé pour l'axe Y est donc la valeur moyenne de chaque enregistrement. Ensuite, une barre d'erreur de la valeur moyenne est ajoutée pour représenter les valeurs de tous les enregistrements.
Vous devrez peut-être faire attention à ce domaine.
Si vous voulez la valeur totale de Survived au lieu de la moyenne, est-il préférable de l'agréger avec Pandas, puis de la représenter graphiquement? Il y a peut-être d'autres moyens.
barplot2.py
titanic_grpby = titanic.groupby( ['sex', 'class'])
titanic_data_for_graph = titanic_grpby['survived'].aggregate(sum).reset_index()
sns.barplot(x='sex', y='survived', hue= 'class', data=titanic_data_for_graph)
Utilisez Count plot lorsque vous souhaitez compter les données correspondant à l'axe X à partir de la valeur sur l'axe Y. Comme pour l'histogramme, il vous suffit de définir l'axe des x.
À propos, la couleur du graphique peut également être spécifiée avec l'option appelée palette.
countplot.py
sns.countplot(x='sex', hue='embarked', data=titanic, palette='Greens_d')
Recommended Posts