Bonjour. Il s'agit de Hayashi @ Ienter.
Dans le précédent Blog, la bibliothèque d'analyse de données Python "scikit-learn" Introduction de l'analyse de régression dans.
À ce moment-là, j'ai installé un package Python appelé Anaconda. Cette fois, nous avons introduit Pandas et Seaborn pour la visualisation de données aux États-Unis. Analysons le parc automobile.
Tout d'abord, importez la bibliothèque de base pour l'analyse avec le notebook jupyter.
Gérer le temps, lire le module datetime et les données de l'extérieur Préparez le DataReader pour utilisation.
Par exemple, écrivons un processus pour lire les données de l'année écoulée de "[General Motors](https://ja.wikipedia.org/wiki/General Motors)" sur le site Yahoo. À propos, le code de marque de General Motors est "GM".
Maintenant, affichons les 5 premières données.
La signification de chaque colonne est la suivante.
--Ouvert: prix ouvert --Haut: prix élevé
Vérifions la transition du cours de clôture sur le graphique. Pour le cours de clôture, utilisez le cours de clôture ajusté de "Adj Close".
Les fluctuations quotidiennes sont un indicateur clé du risque d'investissement en actions. Par exemple, la transition de fluctuation peut être calculée à l'aide de la fonction pct_change de Series.
Auparavant, je me suis concentré sur le cours de l'action de General Motors. Examinons ensuite la corrélation des cours des actions entre les entreprises du même secteur.
Introduisez "Seaborn" pour visualiser la corrélation.
Il peut être installé en entrant la commande suivante sur la ligne de commande.
pip install seaborn
Importez le module.
Cette fois, nous examinerons la corrélation des cinq entreprises suivantes en tant que constructeurs automobiles.
--General Motors (code de marque "GM") --Ford Motor (code de marque "F") --Toyota (code de marque "TM") --Honda (code de marque "HMC") --Tesla Motors (code de marque "TSLA")
Obtenez les données des cours de clôture des 5 sociétés ci-dessus.
Avec les données de cours de clôture de ces sociétés, nous calculerons les données de fluctuation quotidiennes.
J'essaierai de le tracer.
Je ne comprends pas vraiment la relation. .. ..
Maintenant, visualisons-le en utilisant la fonction pairplot de Seaborn.
En ce qui concerne la hauteur de la corrélation dans le graphique, plus les points de la droite sont denses, plus la corrélation est élevée. J'espère que vous pouvez l'imaginer. (Référence: [Coefficient de corrélation](https://ja.wikipedia.org/wiki/Coefficient de corrélation))
De ce point de vue Paire de sociétés américaines "GM (General Motors)" et "F (Ford Motors)", Une paire de sociétés japonaises de "TM (Toyota)" et "HMC (Honda)" Je pense que vous pouvez imaginer que la corrélation est relativement élevée.
Au contraire, les entreprises de véhicules électriques retardataires telles que "TSLA (Tesla Motors)" Je pense que vous pouvez imaginer qu'il y a peu de corrélation avec les autres entreprises.
De plus, utilisons la carte thermique de Seaborn pour rendre la corrélation plus facile à comprendre. La valeur du coefficient de corrélation des données entre chaque entreprise est exprimée par la profondeur de couleur. La forme est plus facile à comprendre visuellement.
C'est tout pour cette histoire!
Recommended Posts