Méthode de visualisation de données utilisant matplotlib (+ pandas) (5)

Il s'agit du dernier épisode de l'histoire de la visualisation de données qui s'est poursuivie jusqu'au précédent.

Nuage de points

Nous utiliserons les données de pydata-book comme auparavant.

pydata-book/ch08/macrodata.csv https://github.com/pydata/pydata-book/blob/master/ch08/macrodata.csv

import numpy as np
from pandas import *
import matplotlib.pyplot as plt

#Lire les données CSV
macro = read_csv('macrodata.csv')

#Ramassez quelques lignes
data = macro[['cpi', 'm1', 'tbilrate', 'unemp']]

# .diff()La méthode modifie la valeur à la différence de la ligne précédente
#Parce que ça commence par NaN.dropna()Supprimer avec méthode
trans_data = np.log(data).diff().dropna()

# trans_les données seront un ensemble de données montrant les modifications par rapport à la ligne précédente
#Afficher les 5 dernières lignes
print( trans_data[-5:] )
# =>
#           cpi        m1  tbilrate     unemp
# 198 -0.007904  0.045361 -0.396881  0.105361
# 199 -0.021979  0.066753 -2.277267  0.139762
# 200  0.002340  0.010286  0.606136  0.160343
# 201  0.008419  0.037461 -0.200671  0.127339
# 202  0.008894  0.012202 -0.405465  0.042560

#Tracer un diagramme de dispersion à partir de deux lignes
plt.scatter(trans_data['m1'], trans_data['unemp'])

plt.show()
plt.savefig("image.png ")

image.png

Matrice de diagramme de dispersion

Le diagramme de dispersion de toutes les paires d'une série de variables est la matrice du diagramme de dispersion (http://www.okada.jp.org/RWiki/?%A5%B0%A5%E9%A5%D5%A5% A3% A5% C3% A5% AF% A5% B9% BB% B2% B9% CD% BC% C2% CE% E3% BD% B8% A1% A7% BB% B6% C9% DB% BF% DE% B9% D4% CE% F3). Vous pouvez créer cela avec la fonction scatter_matrix.

#Générer une matrice de diagramme de dispersion
from pandas.tools.plotting import scatter_matrix
scatter_matrix(trans_data, diagonal='kde', color='k', alpha=0.3)

plt.show()
plt.savefig("image2.png ")

image2.png

Il s'agit d'un moyen simple et puissant d'examiner la corrélation de deux données unidimensionnelles.

référence

Introduction à l'analyse de données avec le traitement des données Python en utilisant NumPy et pandas http://www.oreilly.co.jp/books/9784873116556/

Recommended Posts

Méthode de visualisation de données utilisant matplotlib (+ pandas) (5)
Méthode de visualisation de données utilisant matplotlib (+ pandas) (3)
Méthode de visualisation de données utilisant matplotlib (+ pandas) (4)
Méthode de visualisation de données utilisant matplotlib (1)
Méthode de visualisation de données utilisant matplotlib (2)
Visualisation des données avec les pandas
Implémentez "Data Visualization Design # 3" avec pandas et matplotlib
Application Python: visualisation de données, partie 2: matplotlib
Analyse de données à l'aide de pandas python
Traçage de données polyvalent avec pandas + matplotlib
Graphique des données de séries chronologiques en Python à l'aide de pandas et matplotlib
Cas utilisant un tracé de pandas, cas utilisant un tracé matplotlib (pur)
Implémentez "Data Visualization Design # 2" avec matplotlib
lecture de données pandas
Visualisation des données de coordonnées de latitude / longitude (en supposant des données météorologiques) à l'aide de cartopy et matplotlib
Essayez d'utiliser PHATE, une méthode de réduction et de visualisation des données biologiques
Essayez d'utiliser matplotlib
Lire les données csv Python avec Pandas ⇒ Graphique avec Matplotlib
[Pandas] Principes de base du traitement des données de date à l'aide de dt
100 langage de traitement knock-20 (à l'aide de pandas): lecture de données JSON
Traitement de 100 langues knock-98 (en utilisant des pandas): Clustering par méthode Ward
100 traitement du langage knock-99 (à l'aide de pandas): visualisation par t-SNE
Analyse des données à l'aide de xarray
Analyse des données financières par pandas et leur visualisation (2)
Obtenez des données Amazon RDS (PostgreSQL) à l'aide de SQL avec pandas
Bibliothèques de visualisation de données Python
Analyse des données financières par pandas et leur visualisation (1)
Tableau croisé à l'aide de Pandas
Comment récupérer des données de courses de chevaux à l'aide de pandas read_html
Dessin graphique avec matplotlib
[Dernière méthode] Visualisation des données de séries chronologiques et extraction de modèles fréquents à l'aide du profil Pan-Matrix
Nettoyage des données 2 Nettoyage des données à l'aide de DataFrame
J'ai essayé d'utiliser matplotlib
Nettoyage des données à l'aide de Python
J'ai essayé de regrouper les données ECG en utilisant la méthode K-Shape
[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)
Manipulation des données avec les Pandas!
Agréger les données d'événement dans un format un seul utilisateur sur une ligne à l'aide de pandas
Traiter les données csv avec python (traitement du comptage à l'aide de pandas)
Mélangez les données avec les pandas
Comment visualiser les données par variable explicative et variable objective
[Mémo] Correspondance de texte dans le cadre de données pandas à l'aide de Flashtext
Appel de méthode avec __getattr__
[Exercice Numpy / pandas / matplotlib 01]
Créez instantanément un diagramme de données 2D à l'aide de matplotlib de python
Comment ajouter de nouvelles données (lignes droites et tracés) à l'aide de matplotlib
Méthode de confirmation de la pratique / des données [Pandas] facile à comprendre pour les diplômés du secondaire
Analyser les cours des actions à l'aide de l'agrégation de données pandas et des opérations du groupe
[Python] Extraction / combinaison de données aléatoires à partir de DataFrame en utilisant random et pandas
pandas Matplotlib Résumé par utilisation
Dessinez plusieurs graphiques à l'aide de Pandas
Essayez d'utiliser matplotlib avec PyCharm
Sélectionnez des fonctionnalités avec des données textuelles
Classer les données par la méthode k-means
Méthode de dessin graphique avec matplotlib
Visualisation des données par préfecture
Graphique des données Excel avec matplotlib (2)
Méthode de régression linéaire utilisant Numpy
Mémo de visualisation par pandas, seaborn
Comportement de la méthode pandas rolling ()