Je le fais comme résultat d'étude, alors je peux faire une erreur. N'hésitez pas à commenter.
Cette fois, j'ai écrit "Statistiques prédictives (Théorie)" dans l'article précédent, mais je pense qu'il y a des choses qui ne peuvent pas être comprises à partir de la théorie seule, donc en fait python Je vais m'entraîner à utiliser la bibliothèque de. Cette fois, nous utiliserons une méthode appelée régression </ b> dans la prédiction.
・ Flux de modélisation ・ Faisons une analyse de régression simple
(1) Déterminez à l'avance la variable explicative (axe x) et la variable objective (axe y). ② Lisez les données ③ Préparez les variables pour stocker le modèle ④ Création de modèle ⑤ Prédire à partir du modèle
C'est une analyse simple, mais le flux de code réel ressemble à ceci:
import pandas as pd
import numpy as np
from matplotlib import pyplot
%matplotlib inline #Affichage actuel du navigateur
from sklearn.linear_model import LinearRegression as LR #Classe qui effectue une régression linéaire
train = pd.read_csv("train.csv") #Phase (2), lecture des données d'entraînement
test = pd.read_csv("test.csv") #Phase (2), lecture des données d'évaluation
sample = pd.read_csv("sample.csv") #Phase (2) Lire l'exemple pour écrire les données d'évaluation
trainX = train["Nom de colonne"] #Définition de variables explicatives
testX = test["Nom de colonne"] #Variable explicative
y = train["Nom de colonne"] #Définition de la variable objectif
trainX = trainX.values.reshape(-1,1) #Dans le cas d'une régression simple, il est nécessaire de préparer les données
testX = testX.values.reshape(-1,1)
model = LR() #Préparer les variables pour le modèle de régression ③ Phase
model.fit(trainX, y) #Créer un modèle de régression simple ④ phase
pred = model.predict(testX) #Remplacez le résultat de la prédiction par testX et donnez la valeur de y pour chaque nom de colonne
sample["Nom de colonne que vous souhaitez attribuer"] = pred #Insérer une prédiction dans un fichier d'exemple
sample.to_csv("nom de fichier.csv") #Écrivez le fichier de données
* Si les noms des colonnes train et test ne sont pas les mêmes, cela n'a pas de sens. </ b>
Recommended Posts