Cet article est un mémorandum de référence pour l'auteur, qui est un débutant en programmation, pour promouvoir l'apprentissage automatique.
Je décrirai des informations qui ont été utiles du point de vue d'un amateur.
Je veux aussi essayer le machine learning à la mode, donc j'essaye depuis le début.
Tout d'abord, j'aimerais vous présenter un service qui vous permet d'apprendre facilement ce qu'est l'apprentissage automatique.
L'inscription gratuite est requise, mais vous pouvez apprendre une introduction à l'apprentissage automatique avec des vidéos. Il n'y a pas beaucoup de contenu gratuit, mais cela pourrait être bon pour les personnes qui souhaitent un aperçu rapide. Il existe également un cours pour débutants sur Python, de sorte que même les personnes qui n'ont jamais touché au programme peuvent trouver facile de commencer.
https://aidemy.net/
https://www.codexa.net/ De même, l'inscription gratuite est requise, mais vous pouvez également apprendre gratuitement les parties essentielles de l'apprentissage automatique telles que l'algèbre linéaire et les statistiques. (C'était incroyablement sauvé)
Je voudrais faire une entrée par le haut, puis faire quelque chose comme sortie.
Cette fois, nous allons faire un exemple ** "Fonction recommandée" **. C'est aussi Amazon.
J'ai fait référence aux sites suivants. Il a été écrit avec soin pour les débutants et était très facile à comprendre.
https://www.codexa.net/collaborative-filtering-k-nearest-neighbor/
Si vous vous référez à l'article ci-dessus, je pense que vous pouvez presque le copier, mais j'en suis un peu accro, alors je vais l'écrire.
(En premier lieu) autocomplete-python dans Atom ne fonctionne pas J'ai utilisé Atom comme éditeur pour créer l'environnement, mais l'autocomplete-python installé à ce moment-là ne fonctionnait pas ... Quand j'ai googlé 「C:\Users\username.atom\packages\autocomplete-python\lib\jedi\parser」 C'était inutile si le ver d'un fichier appelé grammarX.X.txt (X est un ver de python) ne correspond pas au ver de Pyhton dans mon environnement. (Il existe un tel article sur StackOverFlow, et j'y ai fait référence.)
Piège d'erreur de mémoire J'ai procédé selon l'article du tutoriel, même si c'était bon au début J'ai ** Erreur de mémoire: impossible d'allouer… **
Puisqu'il gère une grande quantité de données, ce type d'erreur semble être inhérent à l'apprentissage automatique. J'ai essayé deux solutions:
--Utilisez Dask Cela semble être une bibliothèque pour gérer de grandes quantités de données qui ne tiennent pas dans la mémoire. C'est le traitement du pivot qui a causé l'erreur de mémoire cette fois. J'ai essayé d'écrire uniquement cette partie de manière distribuée, mais cela n'a pas fonctionné et j'ai abandonné ... (Je veux que quelqu'un me dise ...)
--Réduire le nombre d'éléments de données Cette fois, j'ai commencé avec un tutoriel, donc je l'ai rapidement résolu ici. Plus précisément, il existe un processus selon lequel «les membres (le nombre d'utilisateurs appartenant au groupe d'anime concerné) coupent les données de 10 000 ou moins», mais j'ai simplement augmenté progressivement ce nombre.
Bien que je triche comme ci-dessus, j'ai pu terminer le tutoriel pour le moment.
En tant que point de départ de l'apprentissage automatique, je suis personnellement satisfait de l'utilisation des fonctions de base et de la prise en compte et du traitement des données. Nous continuerons à nous consacrer à créer quelque chose qui puisse être utilisé dans la pratique.
Recommended Posts