Une bibliothèque pour dessiner des graphiques Python. .. Positionné comme une fonction wrapper (programme inclus) de matplotlib, qui est la libra la plus connue. En plus de pouvoir facilement dessiner de beaux graphiques, il dispose également d'un certain nombre de fonctions telles que le traitement par lots. Matplotlib est destiné aux spécifications et aux dessins détaillés, et seaborn est conçu pour être facile et beau.
Le thème cette fois est l'intrigue par paires. N'est-ce pas la fonction la plus célèbre de seaborn? Utilisez .pairplot
pour le créer. Il permet d'appréhender la corrélation des données.
Tout d'abord, installez la bibliothèque seaborn
avec pip. Pour pip?, Cliquez ici ('https://qiita.com/Yanagawa_Yoshihisa/items/35e6f70a8411277282ce').
Importez la bibliothèque. Nommez seaborn`` sns
et ʻimport`.
python
import seaborn as sns
J'essaierai l'exemple avec les données du Titanic. Si vous ne connaissez pas Titanic, veuillez cocher "kaggle Titanic". Créez une trame de données avec des pandas.
python
dataframe = pd.read_csv('train.csv')
Utilisez .jointplot
pour créer un diagramme de dispersion. Fondamentalement, vous définissez les données d'origine et l'axe que vous souhaitez tracer.
Ici, sélectionnez Age (âge), Fare (tarif) et Pclass (grade) comme axes à tracer et définissez-les sur vars
.
python
sns.pairplot(dataframe, vars = ['Age','Fare','Pclass'])
J'ai pu dessiner un graphique comme celui-là.
Quant à la lecture du graphique, une matrice n × n d'éléments sur l'axe est créée. Les intersections des mêmes axes (zones dans le cadre bleu) sont une matrice d'éléments individuels. L'autre zone est un diagramme de dispersion de l'axe cible et de l'axe. Les graphiques en nuage de points diagonaux sont liés aux graphiques en nuage de points avec les axes permutés. (Le cadre rouge est le même diagramme de dispersion, mais les axes X et Y sont interchangés.) Avec cette fonction, vous pouvez avoir une idée approximative de l'image globale de l'élément. (En regardant le tarif et l'âge dans le cadre rouge, il ne semble pas y avoir de corrélation facile à comprendre entre l'âge et le tarif.)
L'option hue
vous permet de définir l'axe Z. Ajoutez le sexe comme exemple.
python
sns.pairplot(dataframe, vars = ['Age','Fare','Pclass'], hue = 'Sex')
Il est également possible de passer à un histogramme avec diag_kind =" hist "
.
python
sns.pairplot(dataframe, vars = ['Age','Fare','Pclass'], hue = 'Sex' ,diag_kind="hist")
C'est une syntaxe très simple, mais elle est recommandée pour ceux qui ne la connaissent pas car elle y ressemble et donne l'impression de le faire.
Vous pouvez spécifier diverses autres options, donc si vous voulez creuser plus profondément, veuillez consulter le Document officiel.
Comme un débutant peut le comprendre, nous avons résumé les connaissances nécessaires lors de la mise en œuvre de l'apprentissage automatique avec Python dans un simple article. La table des matières est ici, donc j'espère que vous pourrez également vous référer à d'autres articles.
Recommended Posts