Challenge Kaggle [Prix de la maison]

Aperçu

J'ai lancé un défi pour prédire le prix d'une maison à partir de caractéristiques telles que la superficie du site et l'âge.

Définition de la bibliothèque

import pandas as pd

Lecture des données d'entraînement et des données de test

train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

Division des données d'entraînement et des données de test

Séparer en la variable objective «Prix de vente» et d'autres variables dépendantes.

train_x = train.drop(['Id', 'SalePrice'], axis=1)
train_y = train['SalePrice']
test_x = test.drop(['Id'], axis=1)

Remplacer les variables catégorielles par des nombres

for column in train_x.columns:
    labels, uniques = pd.factorize(train_x[column])
    train_x[column] = labels
for column in test_x.columns:
    labels, uniques = pd.factorize(test_x[column])
    test_x[column] = labels

Ajustement avec régression linéaire

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(train_x, train_y)

Prévoir

pred_y = regressor.predict(test_x)

Création CSV

submission = pd.DataFrame({'Id':test['Id'], 'SalePrice':pred_y})
submission.to_csv('submission.csv', index=False)

Recommended Posts

Challenge Kaggle [Prix de la maison]
Prix Kaggle House ③ ~ Prévisions / Soumission ~
Prix des maisons Kaggle ② ~ Modélisation ~
Prix des maisons Kaggle ① ~ Ingénierie des fonctionnalités ~
RECRUTER Challenge @ kaggle
Kaggle ~ Prévision de prix de l'immobilier ② ~
Un spécialiste du marketing amateur en apprentissage automatique a contesté les prix des maisons de Kaggle (partie 1)
Prix des logements: techniques de régression avancées