Je vais expliquer la série d'étapes allant de la lecture d'un fichier CSV basé sur les données publiques de l'OMS à sa représentation graphique.
Le site auquel j'ai fait référence est ici.
Le site ci-dessus est expliqué en supposant que vous avez une connaissance de base de Python et matplotlib.
Dans cet article, je vais résumer les points que je n'ai pas compris. Une explication supplémentaire est écrite pour que même les débutants puissent la comprendre.
Notre objectif est d'atteindre les objectifs suivants:
Commencez par charger le CSV.
import pandas as pd
#Capture de données
df = pd.read_csv("COVID-19.csv", index_col='Date', parse_dates=['Date'])
J'importe une bibliothèque appelée pandas et je lis un fichier CSV. pandas est une bibliothèque qui fournit des structures de données faciles à utiliser et des outils d'analyse de données tels que le chargement CSV.
Pour le contenu de base du japonais, vous pouvez comprendre ce que vous pouvez faire en regardant ici.
Les arguments de pandas.read_csv () sont:
Il y a beaucoup d'autres paramètres disponibles, donc c'est déroutant au début, mais je pense que ce n'est pas grave si vous les comprenez un par un.
python
import matplotlib.dates as mdates
Il fait référence à une bibliothèque appelée matplotlib. matplotlib est une bibliothèque qui vous permet de créer des visualisations statiques, animées et interactives en seulement quelques lignes.
Parmi eux, cette fois, nous utiliserons matplotlib.dates pour gérer les données de séries temporelles avec l'axe horizontal comme date.
Vous pouvez ajouter un alias en ajoutant ʻasà l'instruction d'importation. Vous pouvez l'appeler en écrivant
mdates au lieu de
matplotlib.dates` à chaque fois.
python
#Obtenez un motif de couleur
cmap = plt.get_cmap("tab10")
Cette fois, chaque ligne doit être codée par couleur afin d'afficher plusieurs données sur un graphique. Il est difficile de penser aux couleurs une par une, c'est donc une bibliothèque qui a un motif de couleur approprié.
C'est une image qui bascule le cmap à lire en fonction du nombre de lignes à afficher.
Utilisez beaucoup de couleurs avec matplotlib
python
#Définir l'échelle à définir
locator = mdates.AutoDateLocator()
formatter = mdates.ConciseDateFormatter(locator)
Lors de la création d'un graphique, il y a différentes décisions telles que l'unité d'échelle. Le processus ci-dessus peut être brièvement expliqué comme suit.
python
ax = plt.gca()
Avec plt.gca ()
, l'objet Axes courant est acquis et défini comme objet de ʻax`.
Il semble que de nombreuses personnes aient des doutes sur les objets Axes et les objets Figure.
L'image est la suivante.
objet | La description | Relation parent-enfant |
---|---|---|
Objet de la figure | Aperçu de la figure | Premier parent |
Objet Axes | Zone d'image avec espace de données | Figure enfant classe |
Objet Axis | Echelle (marque sur l'axe) et étiquette d'échelle (chaîne de caractères pour étiqueter l'échelle) | Classe enfant Axes |
Si vous souhaitez comprendre ce qui précède en détail, les articles suivants peuvent être utiles.
[Connaissance de base de matplotlib que je voulais connaître très tôt, ou l'histoire d'un artiste qui peut ajuster l'apparence](https://qiita.com/skotaro/items/08dc0b8c5704c94eafb9#figure-axes-axis%E3%81%AF%E9 % 9A% 8E% E5% B1% A4% E6% A7% 8B% E9% 80% A0% E3% 81% AB% E3% 81% AA% E3% 81% A3% E3% 81% A6% E3% 81 % 84% E3% 82% 8B)
#Refléter l'échelle de l'axe définie sur le graphique
ax.xaxis.set_major_locator(locator)
ax.xaxis.set_major_formatter(formatter)
#dessin
ax.plot(df.index, df['Global Confirmed'], "s-", color=cmap(3))
ax.plot(df.index, df['China Confirmed'], "o-", color=cmap(2))
ax.plot(df.index, df['Global Deaths'], "s-", color=cmap(7))
ax.plot(df.index, df['China Deaths'], "o-", color=cmap(6))
#Tracer des lignes auxiliaires de la grille
ax.grid()
#Affichage de l'échelle du journal de l'axe y
plt.yscale('log')
#Afficher la légende
plt.legend(['Global Confirmed', 'China Confirmed','Global Deaths', 'China Deaths'])
#Enregistrer le fichier
plt.savefig('COVID-19.svg', bbox_inches="tight") #Si svg est défini sur png, il peut être enregistré en tant qu'image
Les résultats d'affichage sont les suivants.
Concernant le graphique affiché, l'axe horizontal est la date et l'axe vertical est le nombre de personnes.
Si vous êtes une telle personne, vous pouvez lire ceci pour comprendre la procédure de progression pour apprendre efficacement le machine learning.
En outre, voici une référence pour des moyens spécifiques d'apprendre Python.
■ COVID-19 ■ Connaissance de base de matplotlib que je voulais connaître très tôt, ou l'histoire d'un artiste qui peut ajuster l'apparence