Références [Finance Machine Learning](https://www.amazon.co.jp/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%8A%E3%83%B3 % E3% 82% B9% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E2% 80% 95% E9% 87% 91% E8% 9E% 8D% E5 % B8% 82% E5% A0% B4% E5% 88% 86% E6% 9E% 90% E3% 82% 92% E5% A4% 89% E3% 81% 88% E3% 82% 8B% E6% A9 % 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E3% 82% A2% E3% 83% AB% E3% 82% B4% E3% 83% AA% E3% 82% BA % E3% 83% A0% E3% 81% AE% E7% 90% 86% E8% AB% 96% E3% 81% A8% E5% AE% 9F% E8% B7% B5-% E3% 83% 9E% E3% 83% AB% E3% 82% B3% E3% 82% B9% E3% 83% BB% E3% 83% AD% E3% 83% 9A% E3% 82% B9% E3% 83% BB% E3% 83% 87% E3% 83% BB% E3% 83% 97% E3% 83% A9% E3% 83% 89-ebook / dp / B0834XJQTY)
Lors de la prévision des données financières, vous devez définir ce que vous souhaitez prévoir, et l'approche est complètement différente en fonction de ce que vous souhaitez prédire. Peut-être êtes-vous le plus familier pour définir si le cours de l'action $ T + 1 $ augmente ou diminue avec le taux de changement de prix ou le code du taux de changement de prix? Cependant, dans certains cas, cela peut être difficile à prévoir, et même si le taux de réponse correct est élevé, le taux de profit moyen et le ratio élevé peuvent être terribles. Un tel problème n'est pas un problème qui peut être résolu par l'étiquetage seul, mais bien que l'étiquetage soit souvent négligé, il a en fait une signification profonde.
Par exemple, supposons que vous ayez Données OHLC quotidiennes du cours moyen de l'action Nikkei.
Si vous souhaitez prédire le cours de clôture du cours moyen de l'action Nikkei le jour ouvrable suivant, chaque cours de clôture étant égal à X_1, X_2, ..., X_T
Dérivé de l'exemple ci-dessus, existe-t-il un exemple où il suffit de donner un taux de réponse correcte de 50% ou plus sur l'étiquette de prédiction? Par exemple, qu'en est-il de ces stratégies? Faites une forte supposition que vous pouvez négocier avec le prix de l'actif et que la liquidité est excellente (ne saute pas). Si vous détenez un nouvel actif à $ T = 0 $ et que le rapprochement augmente de + 1bps ou -1bps, réglez. Il s'agit du modèle binaire le plus simple introduit en finance. Dans ce cas, 50% ou plus des étiquettes prédites auront une valeur attendue positive.
Alors, comment l'étiqueter?
Les données sont des données de graduation des informations du conseil (milieu).
Je veux expliquer l'utilisation du code Python.
label.py
labels = df["mid"].diff().shift(-1).replace(0, np.nan).bfill()
labels = labels / abs(labels)
―― Puisqu'il s'agit d'un changement de 1bps, regardez-le avec un diff.
Dans ce livre, la méthode Triple Barrier, la méthode Trend-Scanning, etc. ont également été introduites, alors pourquoi ne pas jeter un œil?
Recommended Posts