(1) J'ai essayé l'analyse des tendances de la nouvelle couronne avec le modèle de statistiques de Python (2) L'analyse des données du ministère de la Santé, du Travail et du Bien-être a révélé que le premier pic était en avril et que ce pic était en août. (3) Cela signifie que le prochain pic aura lieu en décembre.
(1) Obtenir des données sur les nouvelles personnes infectées par la couronne à partir de la page d'accueil du ministère de la Santé, du Travail et du Bien-être social (2) StatsModel of Python se décompose en tendances, facteurs saisonniers et résidus
(Special Thanks to) J'ai fait référence à Commençons l'analyse des données avec Momoki. Merci beaucoup.
Téléchargez le nombre de personnes séropositives sur le site Web du ministère de la Santé, du Travail et du Bien-être social. J'ai été très impressionné par la facilité avec laquelle il était de télécharger des données csv. Ministère de la santé, du travail et du bien-être, incroyable!
Pour des méthodes d'analyse détaillées, reportez-vous à «Premiers pas avec Momoki et l'analyse des données» ci-dessus.
Tout d'abord, les travaux préparatoires.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import statsmodels.api as sm
% matplotlib inline
Ensuite, les données téléchargées sont lues. Contient des données du 16 janvier.
df=pd.read_csv('pcr_positive_daily.csv')
df.head()
Au fait, les dernières données datent d'hier. En gros, vous pouvez obtenir les données de la veille, mais elles seront mises à jour dans la soirée. Erai est mis à jour même les samedis et dimanches!
df.tail()
Maintenant, jetons un coup d'œil à l'évolution du nombre de personnes infectées jusqu'à présent depuis la seconde moitié de janvier lorsque les données ont été publiées.
%matplotlib inline
df.plot()
Au fait, si vous utilisez matplotlib tel quel, il devient un soi-disant "tofu" (rires) La page suivante a été très utile pour la solution. Merci beaucoup. Comment traduire le graphique de collaboration Google (matplotlib) en japonais!
Eh bien, enfin le sujet principal. Décomposez les données du ministère de la Santé, du Travail et du Bien-être à l'aide du StatsModel de Python.
numbers = pd.Series(df['Nombre de tests PCR positifs(Seule journée)'], dtype='float')
numbers.index = pd.to_datetime(df['Date'])
res = sm.tsa.seasonal_decompose(numbers)
original = numbers #Données d'origine
trend = res.trend #Données de tendance
seasonal = res.seasonal #Données saisonnières
residual = res.resid #Données résiduelles
plt.figure(figsize=(8, 8)) #Création d'un cadre de dessin graphique, spécification de taille
#Graphique des données d'origine
plt.subplot(411) #Graphique 4 lignes 1 colonne 1ère position (haut)
plt.plot(original)
plt.ylabel('Original')
#Tracé des données de tendance
plt.subplot(412) #Deuxième position sur 4 lignes et 1 colonne du graphique
plt.plot(trend)
plt.ylabel('Trend')
#Graphique des données saisonnières
plt.subplot(413) #3ème position sur 4 lignes et 1 colonne du graphique
plt.plot(seasonal)
plt.ylabel('Seasonality')
#tracé des données résiduelles
plt.subplot(414) #4ème position sur 4 lignes et 1 colonne de graphique (en bas)
plt.plot(residual)
plt.ylabel('Residuals')
plt.tight_layout() #Réglage automatique de l'espacement des graphiques
Les résultats sont les suivants. Je l'ai écrit dans le code, mais dans l'ordre du haut, ① Données d'origine ② Données de tendance ③ Données saisonnières ④ Données résiduelles Ce sera.
Veuillez prêter attention aux deuxièmes données de tendance. On peut voir que le premier pic est début avril et ce pic est début août. De ce point de vue, le prochain pic est-il début décembre?
Je prie juste pour que la nouvelle Corona se termine tôt. Cependant, nous reconnaissons que la réalité est dure.
Le nom de la maladie de la nouvelle couronne est COVID-19, mais le nom du virus est SARS-CoV-2. Il semble que ce nom de virus soit similaire au SRAS.
Le SRAS est devenu populaire en 2002, donc c'était il y a presque 20 ans. Cependant, il semble que le vaccin contre le SRAS n'ait pas encore été fabriqué.
Je voudrais faire ce que je peux tranquillement car c'est une période difficile.
Je me sens seul que la fête de l'alcool a disparu en raison de l'influence de la nouvelle Corona, C'était aussi une bonne occasion de promouvoir des styles de travail rationnels tels que la promotion du télétravail.
Vivons calmement dans de tels moments: détendu:
Enfin, je tiens à remercier toutes les personnes impliquées dans le site pour leur référence.
Recommended Posts