J'ai résumé les données des personnes infectées par le nouveau virus corona dans la ville d'Ichikawa, préfecture de Chiba, où je vis.
En premier lieu, Ichikawa City Homepage ne divulgue pas d'informations dans un format pouvant être utilisé secondairement comme données ouvertes. Ce n'est pas beaucoup de données, il y a peu d'éléments et il ne suffit pas d'essayer quelque chose avec cela, mais il semble que cela puisse être utilisé pour de petites choses, alors j'ai essayé de le rendre facile à utiliser. J'ai également posté l'exemple de code (Python).
Il est mis à jour de temps en temps, mais il peut être retardé pour des raisons personnelles.
[08/05/2020] Date de décès ajoutée
URL https://github.com/mine820/COVID-19
Au format CSV, le code de caractère est UTF-8.
Les significations des colonnes sont les suivantes.
--Catégorie
Exemple de code pour l'analyse à l'aide de données. Le fichier est un bloc-notes Jupyter.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
df = pd.read_csv('corona.csv')
df["Date d'apparition"] = df["Date d'apparition"].replace("inconnue", "")
df["Date d'apparition"] = df["Date d'apparition"].replace("enquêter", "")
df["Date d'apparition"] = pd.to_datetime(df["Date d'apparition"], format="%Y-%m-%d")
df["Date de confirmation d'inspection"] = df["Date de confirmation d'inspection"].replace("inconnue", "")
df["Date de confirmation d'inspection"] = df["Date de confirmation d'inspection"].replace("enquêter", "")
df["Date de confirmation d'inspection"] = pd.to_datetime(df["Date de confirmation d'inspection"], format="%Y-%m-%d")
df["Date de décès"] = df["Date de décès"].replace("inconnue", "")
df["Date de décès"] = df["Date de décès"].replace("enquêter", "")
df["Date de décès"] = pd.to_datetime(df["Date de décès"], format="%Y-%m-%d")
#Statistiques récapitulatives
df.describe().loc[:,"Année"]
#Histogramme (âge)
plt.title("Age")
plt.yticks([0,5,10,15,20])
plt.hist(df["Année"], range=(0, 100));
#Date de confirmation d'inspection + moyenne mobile (7 jours)
days = (df["Date de confirmation d'inspection"].max()-df["Date de confirmation d'inspection"].min()).days
hist = plt.hist(df["Date de confirmation d'inspection"], bins=days)
left = np.array(range(days))
num = 7
b = np.ones(num) / num
y2 = np.convolve(hist[0], b, mode='same')
plt.title("Inspection confirmation date")
plt.bar(left, hist[0], color='green');
plt.plot(y2, color='red')
Recommended Posts