[Pratique pour les débutants] Lire ligne par ligne "Prédiction des prix des logements" de kaggle (8e: Création d'un modèle de prédiction)
thème
Le 8ème projet de faire une note du contenu des travaux pratiques que chacun va contester le fameux thème "Prix de la Maison" problème de kaggle. C'est plus un mémo qu'un commentaire, mais j'espère que cela aide quelqu'un quelque part. Les préparatifs ont été achevés la dernière fois, et je suis en état de répéter les réflexions, disant que j'aurais dû étudier plus de statistiques au stade de l'analyse.
- Thème original: https://www.kaggle.com/c/house-prices-advanced-regression-techniques
- Article référencé: https://yolo-kiyoshi.com/2018/12/17/post-1003/
Le travail d'aujourd'hui
Construire un modèle prédictif
StandardScaler () #scaling
Pour le moment, lisez l'article suivant. Et aujourd'hui j'écrirai mes impressions.
- À propos de la conversion d'échelle: https://aizine.ai/preprocessing0614/
Ce que j'ai trouvé:
- Ajuste les valeurs possibles et la plage de la quantité de fonction et la convertit afin qu'elle tienne dans la même plage.
- Exemple) Lorsque "Nombre de visiteurs" et "Température" sont définis comme "Caractéristiques efficaces pour les ventes", la différence est simplement plus grande pour "Nombre de visiteurs" et le jugement de l'importance ne suit pas la mesure réelle. affecter.
- Il existe plusieurs méthodes de conversion d'échelle. Parmi les contenus décrits dans l'article, celui que j'utilise cette fois est souvent utilisé (?) "Conversion Scaler standard"
Modèle de régression par lasso
Je lirai les articles suivants pour le moment, et j'écrirai mes impressions aujourd'hui (deuxième fois).
- Modèle de régression Lasso: https://aizine.ai/ridge-lasso-elasticnet/
- Mot associé "Régression linéaire": https://aizine.ai/glossary-liner-regression/
- Mot associé "surapprentissage": https://aizine.ai/overfitting0206/
- Mot associé "Fonction de coût / erreur quadratique moyenne": https://aizine.ai/glossary-mse/
Ce que j'ai trouvé:
- Comme il s'agit ici d'informations sur les propriétés et qu'il existe de nombreuses variables explicatives, la régression Lasso est adoptée.
Construction de pipelines
- Lisez l'article suivant pour le moment. Et aujourd'hui j'écrirai mes impressions. (3e fois) *
- À propos du pipeline: https://qiita.com/colako/items/b4f4159b77c0a87e978f
Ce que j'ai trouvé:
- Il créera divers flux tels que la mise à l'échelle et la génération de classes. (C'est la phrase que je veux être complètement comprise ...)
C'est tout.
Aujourd'hui, j'ai commencé à lire sans écrire de code, mais il est important de connaître le contexte, ou si je le fais systématiquement après avoir fait cette pratique, je pense que ce sera vrai.