[Matplotlib](http: // matplotlib. Nous nous concentrerons sur la visualisation des données avec org /). A partir de ce moment, ce sera une technique de combinaison en combinaison avec pandas.
Lors du traçage d'objets dans une série ou un bloc de données, il utilise par défaut un graphique à lignes de pliage.
import numpy as np
from pandas import *
from pylab import *
import matplotlib.pyplot as plt
from numpy.random import randn
#Tracé simple en série
s = Series(np.random.randn(10).cumsum(), index=np.arange(0, 100, 10))
s.plot()
plt.show()
plt.savefig("image.png ")
#Tracé simple des blocs de données
df = DataFrame(np.random.randn(10, 4).cumsum(0),
columns=['A','B','C','D'],
index=np.arange(0, 100, 10))
df.plot()
plt.show()
plt.savefig("image2.png ")
La plupart des méthodes de traçage dans les pandas peuvent éventuellement spécifier un objet subplot de matplotlib dans le paramètre ax.
Pour une liste d'options que vous pouvez spécifier pour l'intrigue, vous pouvez vous référer à la documentation officielle ci-dessous.
pandas.DataFrame.plot http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.plot.html
Le plus couramment utilisé est kind, qui vous permet de spécifier un type de ligne. Si kind = 'bar', ce sera un graphique à barres.
#Visualisez la série
data = Series(np.random.randn(16), index=list('abcdefghijklmnop'))
#Graphique à barres verticales
data.plot(kind='bar', ax=axes[0], color='k', alpha=0.7)
#Graphique à barres horizontales
data.plot(kind='barh', ax=axes[1], color='r', alpha=0.6)
plt.show()
plt.savefig("image3.png ")
Si vous transformez le bloc de données en graphique à barres, les valeurs de chaque ligne sont regroupées.
#Visualisez le bloc de données
df = DataFrame(np.random.randn(6, 4),
index=['1','2','3','4','5','6'],
columns=Index(['A','B','C','D'], name='Genus'))
print( df )
# =>
# Genus A B C D
# 1 -0.350817 -0.017378 -0.991230 -0.223608
# 2 0.478712 -0.472764 0.677484 -0.852312
# 3 1.402219 0.381440 0.370080 0.682125
# 4 -1.733590 0.296124 -0.014841 1.140705
# 5 0.373399 1.150718 1.341984 1.040759
# 6 -0.013301 -0.202793 -1.367493 -0.572954
df.plot()
plt.show()
plt.savefig("image4.png ")
df.plot(kind='bar') #Créer un graphique à barres
plt.show(grid=False, alpha=0.8)
plt.savefig("image5.png ")
df.plot(kind='barh', stacked=True, alpha=0.5) #Créer un graphique à barres empilées(option empilée)
plt.show()
plt.savefig("image6.png ")
Précédent [Analyse des données financières et leur visualisation](http://qiita.com/ynakayama/items/32b1ca2a108876f889cc Essayez de tracer avec pandas + matplotlib en utilisant le csv utilisé dans).
df = read_csv('stock_px.csv') #Lire CSV
print( df.head(10) ) #Le début de la trame de données
# =>
# [6 rows x 4 columns]
# Unnamed: 0 AAPL MSFT XOM SPX
# 0 2003-01-02 00:00:00 7.40 21.11 29.22 909.03
# 1 2003-01-03 00:00:00 7.45 21.14 29.24 908.59
# 2 2003-01-06 00:00:00 7.45 21.52 29.96 929.01
# 3 2003-01-07 00:00:00 7.43 21.93 28.95 922.93
# 4 2003-01-08 00:00:00 7.28 21.31 28.83 909.93
# 5 2003-01-09 00:00:00 7.34 21.93 29.44 927.57
# 6 2003-01-10 00:00:00 7.36 21.97 29.03 927.57
# 7 2003-01-13 00:00:00 7.32 22.16 28.91 926.26
# 8 2003-01-14 00:00:00 7.30 22.39 29.17 931.66
# 9 2003-01-15 00:00:00 7.22 22.11 28.77 918.22
df.plot()
plt.show()
plt.savefig("image7.png ")
Il était très facile de visualiser les données CSV.
Recommended Posts