Cet article est l'article du 19e jour du Calendrier de l'Avent Kaggle 2019.
Bonjour, je m'appelle kiccho1101! Écrivez un article pour la première fois de ma vie! Je vous remercie!
Cette fois, j'aimerais vous présenter la gestion de la quantité de fonctionnalités de Kaggle car elle est meilleure que ce à quoi je m'attendais lorsque je l'ai essayé avec PostgreSQL.
Cliquez ici pour le répertoire créé: https://github.com/kiccho1101/datascience-template ↑ Le README contient des exemples d'utilisation utilisant les données du Titanic Competition.
Dans la compétition Kaggle, si vous écrivez le code sans penser comme moi (autrefois), les problèmes suivants se produiront.
――Je ne sais pas ce que représente la quantité de caractéristiques --notebook est dans un état chaotique (exp1.ipynb, exp1_tmp.ipynb, exp1_tmp_tmp.ipynb, etc. sont générés en grand nombre) «Quand j'ai regardé en arrière six mois plus tard, est-ce que je l'ai écrit moi-même? ?? ?? Le code est généré
Afin de résoudre ces problèmes, il est nécessaire de gérer les fonctionnalités d'une manière ou d'une autre.
Pour la gestion du montant des fonctionnalités, [diapositive de Takanobu Nozawa](https://speakerdeck.com/takapy/detafen-xi-konpenioite-te-zheng-liang-guan-li-nipi-bi-siteiruquan-ren-lei- nichuan-etaixiang-i) est très facile à comprendre, donc j'apprécierais que vous y fassiez référence.
Les fonctionnalités de ce répertoire sont résumées ci-dessous.
En utilisant la base de données
Vous pouvez voir les données dans la visionneuse de base de données telles que. Ceci est vraiment bon. EDA est beaucoup plus facile que de le faire avec des pandas.
Comme ça, j'ai rendu possible d'exécuter des opérations fréquemment effectuées avec la commande make. Cela réduit simplement la quantité de code que j'écris, mais c'est assez confortable à coder.
Cette fois, le code sera le code principal, je ne l'ai donc expliqué que brièvement dans l'article. Si vous le trouvez "intéressant", veuillez le cloner et l'utiliser! !!
finalement Pull request et les gens sont les bienvenus! !! !! N'hésitez pas à nous contacter! !! !!
Recommended Posts