Lorsque je travaille en tant que consultant en données, j'utilise souvent Pandas dans Jupyter pour visualiser les valeurs que j'obtiens de la base de données devant le client, je vais donc résumer la visualisation autour de l'étape finale.
Si vous utilisez ceux énumérés ici, je pense que la plupart du travail sera effectué. Reportez-vous au didacticiel pour savoir comment les utiliser. Ce n'est pas si difficile.
matplotlib
Bibliothèque de base. Tout le monde utilise
seaborn
Une bibliothèque basée sur matplotlib qui visualise les résultats de l'analyse statistique de manière visuelle. Vous pouvez également écrire un dendrogramme. Peut être lié aux pandas.
bokhe
Une bibliothèque de visualisation écrite en JS avec un scratch complet Si vous utilisez matplotlib tel quel, une image sera générée sur Jupyter, mais si vous utilisez bokhe, vous pouvez effectuer des opérations interactives telles que la mise à l'échelle. Il peut être utilisé assez facilement dans les démos clients. Je peux faire des animations, mais c'est terne.
ggplot
Version Python de ggplot2 pour R. Utile pour visualiser les résultats de pandas DataFrame et modèle de statistiques. J'ai l'impression de ne pas m'y être encore habitué, donc pour le moment, j'ai l'impression que je devrais utiliser seaborn.
plotly
Un outil de visualisation basé sur le cloud qui peut également être utilisé à partir de python via une API. Il existe une collaboration entre Pandas et Jupyter. Vous pouvez publier des graphiques sur le Web. C'est extrêmement sophistiqué, et même les tracés 3D se déplacent de manière gluante. Si vous ne l'utilisez que sur Jupyter sans le publier, il semble qu'il n'y ait pas de limite, donc j'aimerais l'utiliser à l'avenir. (https://plot.ly/python/offline/)
MLPD3
L'interface matplotlib qui peut être visualisée avec D3.js telle quelle. C'est pratique lorsque vous souhaitez mettre le résultat du pétrissage avec Jupyter tel quel sur l'application Web du tableau de bord.
Recommended Posts