Il y a eu une histoire sur le travail de gestion d'un système immobilier en tant que service, et qu'il n'y a aucune perte à faire sur le terrain. C'est pourquoi nous avons décidé de contester ensemble le fameux problème du «prix de la maison» du kaggle. J'ai donc décidé de poster le contenu de la lecture de chaque ligne sur qiita car ce serait utile plus tard si je le notais correctement. C'est plus un mémo qu'un commentaire, mais j'espère que cela aide quelqu'un quelque part.
J'expliquerai chaque bibliothèque une par une quand je l'ai utilisée dans le travail, donc j'ai copié ceci comme sort une fois.
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.pipeline import make_pipeline
from sklearn.linear_model import (
LinearRegression,
Ridge,
Lasso
)
%matplotlib inline
Le vrai travail commence à partir d'ici. Tout d'abord, lisez et formatez le fichier CSV à utiliser. Pour le moment, copiez ceci. Expliquez un par un.
#Lire les données
train = pd.read_csv('train.csv') #Données d'entraînement
test = pd.read_csv('test.csv') #données de test
#Fusionner les données d'entraînement et les données de test
train['WhatIsData'] = 'Train'
test['WhatIsData'] = 'Test'
test['SalePrice'] = 9999999999
alldata = pd.concat([train,test],axis=0).reset_index(drop=True)
print('The size of train is : ' + str(train.shape))
print('The size of test is : ' + str(test.shape))
Source applicable: train = pd.read_csv ('train.csv') #training data
Description: A l'aide des pandas importés par "import pandas as pd", importez le fichier CSV et stockez-le dans la variable "train". En tant qu'interprétation personnelle, pandas est une bibliothèque de plaques de fer utilisée pour traiter facilement les données de manière tabulaire.
Référence: https://dividable.net/programming/python-pandas/
train ['WhatIsData'] = 'Train'
print ('La taille du train est:' + str (train.shape))
C'est tout pour aujourd'hui. Je vais l'utiliser une heure par semaine pour le mettre en place, donc c'est la vitesse comme une tortue, mais merci pour votre patronage.
Recommended Posts