Le chapitre 3 de Advanced in Financial Machine Learning présente une méthode d'apprentissage automatique en deux étapes qui introduit la méthode de la triple barrière et le Metalabel, et les données actuelles sur le cours de l'action sont le seuil de la triple barrière dans le délai imparti. Il introduit une méthode pour prédire si la limite supérieure est dépassée, si la limite inférieure du seuil de la triple barrière est dépassée ou si les limites supérieure et inférieure du seuil de la triple barrière sont atteintes. Voici un exemple d'application de cette méthode à Bitcoin pour améliorer le score F1 (Financial Machine Learning Part 1: Labels) ). Comme le concept lui-même est encore difficile, j'ai écrit un article qui expliquait en mâchant (Financial Machine Learning Part 1: Labels). J'aimerais.
Article de référence </ b> ・ Amélioration de la métrix de performance par un modèle d'apprentissage en 2 étapes ・ Financial Machine Learning, partie 1: étiquettes
① Le cours actuel de l'action dépasse-t-il la limite supérieure du seuil? </ B> ② Est-il inférieur à la limite inférieure du seuil? </ B> ③ Se déplace-t-il dans les limites supérieure et inférieure du seuil? Je veux prédire </ b>. Il ne prédit pas le cours futur de l'action en lui-même, mais (1) dépassera-t-il la limite supérieure du seuil, (2) tombera-t-il en dessous de la limite inférieure du seuil et (3) restera-t-il dans les limites supérieure et inférieure du seuil? Je veux prédire lequel des trois cas sera.
1er apprentissage automatique des données d'entraînement enregistrant le mouvement de prix des pièces de monnaie dans Triple-Barrier (la limite supérieure du seuil de la Triple-Barrière a été atteinte, la limite inférieure du seuil a été atteinte et elle est tombée dans la Triple-Barrière) à partir de tout moment. Saisie du modèle (régression logistique) et formation du 1er modèle d'apprentissage automatique. Entraînez le deuxième modèle d'apprentissage automatique à l'aide de la sortie du premier modèle d'apprentissage automatique et des données d'entraînement.
La précision peut être améliorée en utilisant un modèle d'apprentissage automatique en deux étapes.
4 décembre 2018 → Nous avons pu améliorer la précision des données de prix Bitcoin à partir du 9 décembre 2018 en appliquant le «modèle d'apprentissage automatique en deux étapes».
● 4 décembre 2018 → Prix Bitcoin le 9 décembre 2018
● La précision et le score F1 pourraient être améliorés en appliquant le "modèle d'apprentissage automatique en deux étapes". (La précision des prévisions s'est améliorée.) </ B> En d'autres termes, en appliquant le "modèle d'apprentissage automatique en deux étapes"
[TN] </ b> Prédiction que le prix changera dans la triple barrière → Prédiction qu'il changera réellement dans la triple barrière [TP] </ b> Augmentation de prix prévue → Augmentation de prix réelle [TP] </ b> Prédit que le prix va baisser → Le prix a en fait baissé. J'ai pu améliorer la fréquence de.
Les données d'entraînement et les données de test ont été entrées dans le modèle d'apprentissage automatique entraîné et la matrice de confusion a été calculée. TP (True Positive) est un modèle de profit, FP (False Positive) est un modèle de réduction des pertes, TN (True Negative), FN (False Negative) est un modèle qui ne fait rien, donc le nombre de TP augmente et le nombre de FP On peut dire qu'il est préférable de réduire.
En fait, le 2ème modèle est comparé au 1er modèle ・ Dans les données d'entraînement ... TP est amélioré et FP est diminué, donc la probabilité de profit s'améliore. La précision et le score F1 sont également améliorés. ・ Dans les données de test ... TP a diminué, FP a diminué. Depuis que la précision et le score F1 se sont améliorés, la probabilité que la prédiction par le modèle d'apprentissage automatique soit correcte a augmenté, mais depuis que TP a diminué et FP a diminué, ce qui peut faire un profit dépend de la situation. (Doit-on évaluer que la probabilité de réduction des pertes diminue)
Le code Jupyter qui a implémenté ce qui précède a été téléchargé ci-dessous.
https://github.com/fdfpy/studyresult/tree/master/3-5
Calculez l'écart type du revenu quotidien en fonction du débit indiqué dans la figure ci-dessous.
Soit volstd ($ t_ {i} $) l'écart type du revenu quotidien au temps $ t_ {i} $. Aussi, laissez le cours de l'action au temps $ t_ {i} $ être $ c [t_ {i}]
\begin{eqnarray}
Label
=
\begin{cases}
1 & ( vol \geqq Vthu ) \\
0 & ( Vthd \lt b \lt Vthu ) \\
-1 & (vol \lt Vthd)
\end{cases}
\end{eqnarray}
Affectez à la matrice de confusion selon la figure ci-dessous.
Recommended Posts