Comment utiliser Matplotlib pour afficher des histogrammes et des diagrammes de dispersion sur Jupyter Notebook.
Le contenu de cet article est testé dans l'environnement Jupyter Notebook préparé conformément à l'article suivant. Installation et démarrage faciles de Jupyter Notebook à l'aide de Docker (prend également en charge nbextensions et Scala) --Qiita
Dans cet environnement, vous pouvez accéder au port 8888 avec un navigateur et utiliser Jupyter Notebook. Vous pouvez ouvrir une nouvelle note en suivant Nouveau> Python 3 sur le bouton en haut à droite.
De plus, dans cet article, un fichier CSV créé au hasard https://github.com/suzuki-navi/sample-data/blob/master/sample-data-1.csv J'utilise.
Lire diverses importations et données.
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("sample-data-1.csv", names=["id", "target", "data1", "data2", "data3"])
df
sera un objet de DataFrame.
Consultez l'article précédent pour lire à partir de CSV et gérer DataFrame. Essayez les opérations de base pour DataFrame-Qiita
Matplotlib documentation https://matplotlib.org/api/_as_gen/matplotlib.pyplot.hist.html#matplotlib.pyplot.hist
plt.hist(df["data1"])
Vous pouvez spécifier le nombre de divisions sur l'axe horizontal avec l'option «bacs».
plt.hist(df["data1"], bins=30)
Vous pouvez spécifier la plage sur l'axe horizontal avec range
.
plt.hist(df["data1"], range=(-100, 100))
Si vous spécifiez «densité = Vrai», il est normalisé de sorte que la somme de l'axe vertical soit de 1,0.
Matplotlib documentation https://matplotlib.org/api/_as_gen/matplotlib.pyplot.scatter.html#matplotlib.pyplot.scatter
plt.scatter(df["data1"], df["data2"])
Si vous spécifiez une colonne d'entiers pour c
, il semble que chaque valeur sera codée en couleur.
plt.scatter(df["data1"], df["data2"], c = df["target"])
Si vous avez beaucoup de points, vous devez spécifier ʻalpha`. «0.0» est transparent, «1.0» est opaque et vous pouvez voir la nuance en spécifiant le milieu.
plt.scatter(df["data1"], df["data2"], c = df["target"], alpha=0.5)
Il semble que vous puissiez spécifier la plage de l'axe horizontal avec les méthodes «xlim» et «ylim».
plt.xlim(-50, 50)
plt.ylim(-5, 5)
c'est tout.
Recommended Posts