Aidemy 2020/10/29
Bonjour, c'est Yope! Je suis une école littéraire croustillante, mais j'étais intéressé par les possibilités de l'IA, alors je suis allé à l'école spécialisée en IA "Aidemy" pour étudier. Je voudrais partager les connaissances acquises ici avec vous, et je les ai résumées dans Qiita. Je suis très heureux que de nombreuses personnes aient lu l'article de synthèse précédent. Merci! Ceci est le quatrième article de la prochaine analyse de la série. Ravi de vous rencontrer.
Quoi apprendre cette fois ・ Construction du modèle SARIMA
-Le modèle __SARIMA __ est un modèle dans lequel ARIMA (p, d, q), qui convertit les données en une série de différences de pas, peut également être utilisé pour des séries temporelles avec un cycle __saisonnier. -Le modèle SARIMA a un paramètre appelé __SARIMA (sp, sd, sq, s) __.
sp,sd,sq -__ Sp, sd, sq__ sont appelés respectivement __ "autocorrélation saisonnière", "dérivation saisonnière" et "moyenne mobile saisonnière" __, et sont fondamentalement les mêmes que p, d, q d'ARIMA. ・ Il a été ajouté que les données de sp, sd et sq sont influencées par les données de la période saisonnière passée. -L'autre paramètre de SARIMA, __ "s" __, représente __ cycle saisonnier __. S'il s'agit d'un cycle de 12 mois, s = 12 doit être défini. -Pour sq, il indique le nombre de cycles avant la "période saisonnière passée" affectée.
-Il est nécessaire de vérifier les valeurs appropriées pour les paramètres ci-dessus. ・ À ce stade, __information montant standard __ est utilisé. Cette fois, j'utiliserai __ "BIC" __. Cependant, cette fois, nous ne traiterons pas cela en détail. ・ Plus la valeur BIC est basse, plus la valeur du paramètre est appropriée.
-__ L'autocorrélation partielle __ est __ sans l'influence des données entre les deux valeurs qui effectuent l'autocorrélation __. -Par exemple, l'autocorrélation partielle entre y1 et y7 est obtenue en supprimant l'influence de y2 à y6 entre eux. -En visualisant cette autocorrélation partielle, la valeur optimale du paramètre __ "s" est définie __. -Une fois visualisée, la valeur de l'autocorrélation partielle devient élevée dans la partie __period, donc cela devrait être la valeur de s.
・ La visualisation (graphique) de l'autocorrélation partielle est effectuée comme suit. __sm.graphics.tsa.plot_pacf (données) __
・ Code (visualisation de la corrélation des données de vente de vin)![Screenshot 2020-10-29 14.27.54.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/ 0/698700 / 81b92856-d4b8-1d98-03e7-28261cb8cabc.png)
・ Résultat![Capture d'écran 2020-10-29 14.28.23.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/3e5a9a67-eb31-5839- b557-ebc383e407e3.png)
・ Procédure de construction ① __Lecture des données __: pd.read_csv () ② __Organisation des données __: pd.date_range () ③ __Visualisation des données __: sm.graphics.tsa.plot_pacf () ④ __Capture (s) du (des) cycle (s) de données __: De ④. ⑤ Paramètres de paramètres autres que __s __: saisir avec BIC --Nouvelle partie d'ici-- ⑥ __ Construction du modèle __: __ sm.tsa.statespace.SARIMAX (). Fit () __ ⑦ __Prédiction / visualisation des données __: __ predict () __ / plt.show ()
・ ⑥ Les arguments de SARIMAX () pour la construction du modèle sont les suivants. __SARIMAX (données, ordre = (p, d, q), ordre_saisonnier = (sp, sd, sq, s)) __
・ ⑦ La prédiction () de la prédiction de données est la suivante. Seul le début de la prédiction doit être l'heure dans les données de la série chronologique. __ Model.predict ("Au début de la prédiction", "À la fin de la prédiction") __
・ Une série d'exécution de code (⑤ n'est pas effectuée)![Capture d'écran 2020-10-29 14.31.57.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/ 0/698700 / cfbcbcc9-9b7b-6a92-d24d-327dfa3f1d97.png)
・ Résultat![Capture d'écran 2020-10-29 14.32.20.png](https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/698700/63b27173-80e3-81fd- 6f4f-d68be98d37b5.png)
-__ SARIMA model__ est un modèle qui rend ARIMA (p, d, q), qui convertit les données en une série de différences, également compatible avec les séries temporelles avec un cycle saisonnier. -Le modèle SARIMA a des paramètres __ (sp, sd, sq, s) __. ・ Pour sp, sd et sq, vérifiez les valeurs appropriées en utilisant la norme __information amount __ appelée BIC. ・ S est examiné en traçant __ autocorrélation partielle __. -Passez ces paramètres à __sm.tsa.statespace.SARIMAX (). Fit () __ pour créer un modèle et faire des prédictions avec __predict () __.
Cette fois, c'est fini. Merci d'avoir lu jusqu'à la fin.
Recommended Posts