Wikipedia
Kaggle est une plateforme de modélisation prédictive et de méthodes analytiques et sa société d'exploitation où les entreprises et les chercheurs publient des données et les statisticiens et les analystes de données du monde entier se disputent le modèle optimal.
En gros, la version Data Scientist de TopCoder
Comme un avant-goût des ingénieurs modernes [Introduction à la théorie de l'apprentissage automatique pour les ingénieurs informatiques](https://www.amazon.co.jp/IT%E3%82%A8%E3%83%B3%E3%82%B8% E3% 83% 8B% E3% 82% A2% E3% 81% AE% E3% 81% 9F% E3% 82% 81% E3% 81% AE% E6% A9% 9F% E6% A2% B0% E5% AD% A6% E7% BF% 92% E7% 90% 86% E8% AB% 96% E5% 85% A5% E9% 96% 80-% E4% B8% AD% E4% BA% 95-% E6% J'ai lu 82% A6% E5% 8F% B8 / dp / 4774176982), mais je n'ai pas la possibilité d'utiliser l'apprentissage automatique au travail car je ne travaille pas dans l'analyse de données. Vous ne pouvez pas apprendre l'apprentissage automatique sans réellement bouger vos mains, mais il semble difficile de bouger vos mains car cela nécessite des préparatifs tels que la préparation d'un ensemble de données, donc je ne sais pas ce qui est réellement approprié pour étudier en tant que matériel pédagogique (MNIST?). .. En tant qu'ingénieur moderne, j'aimerais pouvoir utiliser correctement l'apprentissage en ligne et la communauté, et aussi en acquérir des connaissances. J'ai aimé les concours Kaggle de Dataquest, que j'ai essayés en tant que tutoriel.
Participez au concours de Kaggle Titanic: Machine Learning from Disaster et gagnez votre classement dans le concours.
Getting Start
J'ai appris la régression logistique et la forêt aléatoire par apprentissage automatique Appliquer du code python environnement d'exécution python
Environnement dans lequel le notebook jupyter peut être écrit Compétences en anglais qui ne sont pas si réticentes à lire des sites techniques en anglais
Environnement GPU Connaissances d'apprentissage en profondeur
Concours Kaggle Un site d'apprentissage en ligne qui sort avec titanic.
Free Kaggle Tutorial - Getting Started with the Titanic Dataset
Si vous avez un compte google ou facebook, vous pouvez démarrer le didacticiel dès que vous vous connectez.
Sur la base des données de survie des passagers du Titanic, un modèle paramétrique qui calcule la probabilité de survie des passagers dans les données de test est créé et les performances du modèle sont mises en concurrence. Le thème est la concurrence de Kaggle. Du prétraitement à la création de modèles, en passant par la formation sur les ensembles de données et les tests de prédiction des ensembles de données, nous continuerons avec le didacticiel tout en résolvant le problème de l'écriture de code python à des points clés.
Cet écran est un exemple de l'écran du tutoriel Dataquest. Un exemple apparaît à gauche, écrivez le code python sur l'écran de droite, appuyez sur le bouton d'exécution, et si le résultat du code est correct, il dira «bon travail» et passera à l'écran suivant.
Le didacticiel prend même en charge la génération d'un fichier qui soumet les résultats de prédiction de l'ensemble de données de test du modèle réellement créé à kaggle. Il existe deux cours Kaggle Competition dans Dataquest, le premier est un modèle de régression logistique simple pour expérimenter le flux, et le prochain cours Improving Your Submission est précis avec un modèle d'apprentissage d'ensemble. C'est un cours qui vise à viser un score en augmentant.
Si vous avez les connaissances écrites dans les locaux, je pense que chaque cours peut être complété en 2 heures.
Après avoir étudié le didacticiel, organisez ce que vous avez appris dans votre environnement d'exécution Python, ... (même si vous copiez et collez simplement le code que vous avez écrit dans le didacticiel), et soumettez le fichier à Kaggle. J'ai essayé de générer le code ici.
Soumettez ceci à Kaggle!
Il était 1231e dans l'équipe 7071!
Vous pouvez en faire l'expérience en peu de temps sans vous en soucier, j'ai donc pensé que ce serait un bon matériel pour l'auto-apprentissage et les sessions d'étude après avoir lu le livre d'introduction sur l'apprentissage automatique. Ceci est une ligne de départ, et même si vous concevez un modèle vous-même, vous pouvez étudier dans le sens d'augmenter un peu plus le score. Je participe également à d'autres compétitions. Dans mon cas, j'étudie l'apprentissage profond, je me réfère donc à divers sites pour la compétition chiens vs chats. J'ai essayé de continuer. Pour le moment, le score était de 0,14160, et le score était d'environ 697e / 1314 équipes, mais il semble que la compétition soit déjà fermée, et si elle est fermée, elle ne sera pas inscrite au Rank, donc c'est un peu décevant. fait.
L'auteur de Introduction à la théorie de l'apprentissage automatique pour les ingénieurs en informatique avait le même âge que moi et était diplômé de la même faculté des sciences, département de physique (bien que dans une université différente). Je voudrais apprendre le poids des neurones en rétroprojectant le réseau neuronal de mon cerveau avec l'auteur comme données de l'enseignant pour savoir où et où il y a une telle différence. .. ..
Recommended Posts