Données d'entraînement et données de test (Que sont X_train et y_train?) ②

Dans la continuité du ① précédent, nous allons diviser un peu plus pratiquement les données d'entraînement et les données de test.

Préparez d'abord les données.

Maintenant, il y a deux variables x. image.png Ainsi, en machine learning, lorsqu'il y a deux variables ou plus x Nous les combinerons en un seul et les traiterons comme des majuscules $ \ mathbf {X} $.

Ensuite, divisez-le en données d'entraînement et en données de test.

Données d'entraînement image.png données de test image.png Ensuite, nous créerons une formule modèle à partir des données d'entraînement. Si cela est calculé par la méthode des moindres carrés, il peut être obtenu comme suit.

y=0.9+2x_1+2.0\times10^{-16}x_2

Et nous appliquerons cela aux données de test.

y_{pred}=0.9+2x_{1_{test}}+2.0\times10^{-16}x_{2_{test}}=9,11

D'après ce qui précède, pour y_test des données de réponse correctes J'ai trouvé que le y_pred auquel je m'attendais était à peu près correct.

S'il y a deux ou plus $ x $ pour $ y $ En gros, pensez aux données d'entraînement et aux données de test comme ci-dessus.

Dans le machine learning réel, pour des données comme celle-ci y est le loyer, x1 et x2 sont les éléments constitutifs (marche en gare, âge, etc.) Nous analysons les données.

Aussi, l'article précédent ① et cet article ② Les deux utilisent une méthode appelée régression linéaire. J'espère publier à nouveau dans un proche avenir.

Recommended Posts

Données d'entraînement et données de test (Que sont X_train et y_train?) ①
Données d'entraînement et données de test (Que sont X_train et y_train?) ②
[Python] Que sont @classmethod et les décorateurs?
(Débutant) Que sont les cœurs et les threads?
Que sont les vendeurs de go mod, go get and go?
Que sont les options Linux POSIX et GNU?
[Mathématiques] Visualisons ce que sont les valeurs propres et les vecteurs propres
Division des données de formation en apprentissage automatique et apprentissage / prédiction / vérification
Que comparez-vous avec Python et ==?
Que sont les taples et * args python après tout?
Créer des données d'entraînement
Distribution et test
[Tutoriel PyTorch ⑦] Visualisation des modèles, des données et de la formation avec Tensorboard
Installation de MySQL sur Aws Linux 2 et préparation des données de test