Il s'agit d'un article sur des étudiants universitaires intéressés par la science des données et revenant sur leurs études pendant un an!
Passons au sujet principal!
** ① Organisez votre propre apprentissage ** Après l'avoir fait pendant environ un an, j'oublie ce que j'ai appris jusqu'à présent. C'est parce que je veux l'organiser une fois et l'utiliser pour des études futures. Par conséquent, il peut être difficile de lire de nombreuses expressions subjectives. Si vous avez des questions ou des commentaires, veuillez commenter.
** ② Pour les débutants! ** ** Il a également été écrit dans le livre Shin Nihon, mais d'autres personnes le seront dans le futur. Je pense que je vais commencer à apprendre la science des données. Après avoir lu ce livre, je voulais jouer un rôle actif dans ce domaine à l'avenir, alors j'ai commencé à apprendre sérieusement. Par conséquent, j'ai pensé que les débutants devraient se référer à cet article.
** ① Acquérir des compétences qui peuvent être prouvées **
Je voulais acquérir la qualification pour pouvoir voir facilement les objectifs et garder ma motivation. Je voulais acquérir les connaissances minimales en me référant à ce qui suit, et au cours des six premiers mois j'ai obtenu le test statistique niveau 2 et le test G. Je pense gagner une médaille à Kaggle dans le futur.
** ② Apprenez la théorie **
L'apprentissage de la science des données est particulièrement facile à mettre en boîte noire. J'ai pris le temps d'étudier, mais j'ai pris soin de ne pas être complètement incompris.
** ③ Soyez toujours conscient de la carte du chargeur **
En particulier, les débutants pensent qu'il y a un risque élevé de frustration, ils ont donc créé une feuille de route et étudié afin de calculer à rebours et d'étudier systématiquement.
[[Version 2020 pour les débutants] Méthode d'étude recommandée pour ceux qui souhaitent devenir ingénieur IA par eux-mêmes](https://qiita.com/tani_AI_Academy/items/e47bf4d1316b66a0402b#%E6%9C%AC%E6%B0%97% E3% 81% A7ai% E3% 82% A8% E3% 83% B3% E3% 82% B8% E3% 83% 8B% E3% 82% A2% E3% 82% 92% E7% 9B% AE% E6% 8C% 87% E3% 81% 97% E3% 81% A6% E3% 81% 84% E3% 82% 8B% E6% 96% B9% E3% 81% B8) Édition 2020: compétences requises pour les scientifiques des données et les ingénieurs en apprentissage automatique sur le terrain [Auto-apprentissage possible] Feuille de route d'apprentissage pour l'apprentissage automatique pour les débutants en Python
En me référant aux trois articles ci-dessus, j'ai appris qu'il y a cinq connaissances majeures requises pour la science des données.
J'ai résumé mes connaissances en SQL et en cloud sous d'autres formes car je n'ai pas encore commencé à étudier. J'ai l'intention d'étudier dur à l'avenir.
Ci-dessous, j'écrirai un article de synthèse principalement divisé en 1 à 4 champs!
Si vous êtes débutant, nous avons compilé 3 livres que vous devriez commencer à étudier à partir d'ici!
C'est peut-être le livre le plus célèbre lié à l'apprentissage automatique. C'est également un livre recommandé pour le test G. Qu'est-ce que l'intelligence artificielle? ?? ?? Ceux qui deviennent devraient lire en premier!
Il est facile à lire même pour les personnes qui ne sont pas douées en mathématiques et il est organisé sur la page minimale nécessaire pour comprendre comment les mathématiques sont utilisées dans l'intelligence artificielle. J'étais confus lorsque j'étudiais pour les examens universitaires, mais j'ai été impressionné lorsque j'ai compris pour la première fois que les mathématiques étaient en fait utilisées dans l'apprentissage automatique.
Même si vous êtes débutant, si vous ne supprimez pas ce niveau de mathématiques, vous serez certainement coincé dans la théorie de l'apprentissage automatique, je vous recommande donc de le lire en premier!
Si vous avez lu les deux livres ci-dessus et que vous souhaitez en apprendre davantage, veuillez les lire! Les éléments nécessaires sont écrits de manière simple à comprendre!
J'ai appris deux choses. ** python** Syntaxe de base minimale pour la gestion de python (syntaxe de contrôle pour les instructions if, les boucles, les définitions de classe / méthode, etc.) ** Mise en œuvre de l'apprentissage automatique ** Implémenté basé sur la théorie à l'aide d'une bibliothèque appelée scikit-leran
python
Je pense que c'est un bon livre pour apprendre les bases de la programmation, mais c'est trop difficile pour les débutants qui ne peuvent pas décider de ce qu'il faut apprendre. Je voudrais le relire quand j'ai vraiment besoin de python ② progate
En parlant de programmation débutant, c'est progate! Pour le moment, il est recommandé de faire deux tours pour se faire une idée approximative!
Parmi les différents cours, j'ai suivi un cours de 82 heures appelé le cours «Python Grammar from Inexpérimenté». C'est bien pour les débutants de pouvoir étudier immédiatement car il n'est pas nécessaire de créer un environnement.
Cependant, j'ai senti que ce serait un peu cher de dépenser 3000 yens par mois alors qu'il existe de nombreux matériels pédagogiques qui peuvent être appris gratuitement avec la grammaire de base de python. Aussi, avec le recul, c'est dommage qu'il y ait pas mal de grammaires que je n'ai pas beaucoup utilisées.
Le blog de Tommy, obstétricien et gynécologue, a une collection de Learning roadmaps pour débutants en Python [Vous pouvez également étudier par vous-même sur le blog]. J'ai été impressionné par cette clarté gratuitement! Je pense qu'il est idéal pour les débutants de garder cela sous contrôle pour le moment et d'en apprendre davantage si nécessaire.
Il s'agit d'une conférence de M. Kikagaku d'Udemy. D'autres cours sont présentés ci-dessous, mais les cours de Kikagaku sont tous merveilleux! Où dois-je écrire le code du programme pour les débutants en premier lieu? ?? C'est un commentaire à ce sujet.
Dans ce qui précède, j'ai présenté le cours "Grammaire Python de inexpérimenté", mais j'ai passé deux mois à apprendre deux cours, le cours "analyse de données" et le cours "apprentissage automatique".
La mise en œuvre de l'apprentissage automatique est facile à frustrer car il existe de nombreux livres de référence épais, mais vous pouvez l'apprendre sur Internet. De plus, comme l'explication était destinée aux débutants, elle est idéale comme matériel pédagogique à apprendre après avoir saisi la grammaire de base de python.
Voici le blog de M. Kame, qui est actif en tant que data scientist aux États-Unis. Blog des scientifiques américains sur les données
Une série d'articles sur la mise en route de Python pour la science des données est tout simplement trop bonne pour les débutants!
C'est trop génial d'apprendre la grammaire de base de python, pandas, numpy et visualisation de données sur ce blog.
C'est l'un des livres d'O'Reilly Japan qui est souvent recommandé pour l'apprentissage par machine learning.
Je peux voir la bonté de ce livre maintenant, mais je pense que c'est franchement ennuyeux si vous ne comprenez pas complètement la théorie de l'apprentissage automatique présentée ci-dessous.
Comprendre les mathématiques est très important dans l'apprentissage de la science des données. Je pense que les trois choses qui sont particulièrement importantes sont la différenciation, les statistiques et l'algèbre linéaire.
Cependant, il existe de nombreux matériels pédagogiques qui expliquent l'apprentissage automatique sans utiliser beaucoup de mathématiques, car l'apprentissage des mathématiques augmente les risques de frustration pour les débutants. Par conséquent, la priorité des débutants n'est pas si élevée et je pense qu'il vaut mieux étudier si nécessaire.
Comme j'avais déjà appris la différenciation à l'examen universitaire, j'ai appris l'algèbre linéaire et les statistiques après avoir terminé l'apprentissage de la programmation ci-dessus.
C'est un excellent matériel pédagogique pour les étudiants qui apprennent les bases de l'algèbre linéaire, car il appartient aux étudiants de prendre des crédits pour l'algèbre linéaire.
J'ai réussi l'examen environ six mois après avoir commencé à étudier la science des données. Je pense qu'il est préférable d'apprendre systématiquement les bases des statistiques. J'ai résumé la méthode d'étude dans un autre article. Si vous êtes intéressé, veuillez voir ici!
Seulement ça! Comment réussir la deuxième année du test statistique dans les plus brefs délais
Compréhension prioritaire des algorithmes d'apprentissage automatique de base, à l'exception de l'apprentissage en profondeur.
Il s'agit d'une conférence de M. Kikagaku d'Udemy. J'ai appris deux cours, débutant et intermédiaire.
Sur la base d'un examen de l'algèbre linéaire et de la différenciation, vous pouvez apprendre une série d'étapes jusqu'à l'optimisation en l'appliquant à des problèmes réels tels que la prédiction des rentes. Il existe également des exercices en python.
Ce cours est destiné aux débutants et est recommandé car il est hautement évalué par Udemy.
C'est un matériel didactique vidéo qui est souvent utilisé comme cours pour les débutants. Ce fut une expérience précieuse d’écouter gratuitement des conférences de haut niveau à l’étranger. Je n'ai pas utilisé beaucoup de formules difficiles, et c'était facile à comprendre avec une explication simple. Les sous-titres peuvent être ajoutés en japonais, mais de nombreux points nécessitent une compréhension de l'anglais. De plus, il était pénible de devoir soumettre une mission à l'aide d'un mystérieux outil de calcul appelé octave.
Il s'agit du site où l'Université Tsukuba publie des vidéos de cours. Vous pouvez regarder la conférence sur youtube. Je l'ai regardé parce que je voulais apprendre un contenu plus profond que cousera. J'ai senti que le cours ici était plus facile à comprendre car il était en japonais. Il est fondé sur la connaissance des mathématiques (en particulier l'algèbre linéaire et la différenciation), et j'ai pu comprendre les détails en tirant la preuve de formules mathématiques. Cependant, il est dommage qu'il n'y ait aucune explication des problèmes.
Pour plus d'informations sur le test G, cliquez ici [https://www.jdla.org/certificate/general/)! Je pense que c'est une qualification parfaite pour les débutants à définir comme objectif premier.
Depuis que j'ai compris l'apprentissage automatique avec cousera, j'ai compris l'apprentissage profond avec le manuel officiel et pratiqué les problèmes avec une collection de problèmes appelés Kuromoto et une collection de problèmes attendus qui peuvent être reçus sur le Web.
Peut-être que presque tous ceux qui passent cet examen sont un livre de référence à acheter. Achetez dès que vous décidez de passer l'examen! C'est simple, donc je le vérifie souvent même après avoir réussi l'examen.
C'est un livre qui s'appelle aussi un livre noir. Quand j'ai passé l'examen, je l'ai acheté parce qu'il n'y avait pas d'autre livre de référence que je pouvais pratiquer. C'est devenu l'un des critères pour mesurer la réussite ou l'échec de l'examen, mais j'ai également senti qu'il y avait de nombreuses différences par rapport à l'examen réel.
Ceci est un test simulé (question précédente) du test G publié par "Study-AI" du groupe d'étude sur l'intelligence artificielle.
J'ai senti que ce test simulé était plus similaire au test réel que Kuromoto. 4. kaggle Après avoir appris les bases, de nombreux articles disaient que vous devriez réellement gérer les données, alors j'ai décidé de défier kaggle. Il s'agit d'un site de concours pour les data scientists, qui contient principalement des articles rédigés en anglais et rassemble des concours sponsorisés par des entreprises étrangères.
Signate est célèbre au Japon. Cependant, pour le moment, kaggle est plus célèbre et le code et la solution sont ouverts au public, donc je pense que de nombreux débutants partent de kaggle.
Il y a encore peu de livres à travailler sur kaggle Résumé des matériaux recommandés pour les débutants complets pour terminer «l'introduction» de Kaggle à grande vitesse (version de décembre 2019) J'y ai surtout fait référence. Si vous suivez les instructions ici, vous serez d'accord pour commencer avec kaggle!
Il y a plus d'articles mis à jour maintenant! Résumé des matériaux recommandés pour les débutants en apprentissage automatique pour terminer «l'introduction» de Kaggle à grande vitesse (version de mars 2020)
Pour les débutants, vous pouvez apprendre une série d'étapes à partir de la soumission des résultats d'analyse à l'aide de la compétition titanesque, qui est un tutoriel de kaggle.
Il y avait une gamme à couvrir avec le didacticiel kaggle, mais les deux étaient des réponses correctes. J'ai aimé apprendre car je gère également des données textuelles et des données image.
Si vous faites les deux choses ci-dessus, vous pouvez avoir une idée du kaggle dans une certaine mesure. Cependant, la partie la plus longue du processus d'analyse des données est le prétraitement des données. J'ai appris une théorie sympa de la théorie de l'apprentissage automatique, mais si le prétraitement n'est pas possible, cet algorithme cool sera gaspillé. Il ne prend pas en charge kaggle, mais je pense que ce livre est très précieux car il n'y avait pas beaucoup de livres traitant du prétraitement principalement sur les données de table en python.
J'ai acheté un livre traitant de kaggle parce que c'était le seul lorsque j'étais sur le point de participer au concours à ce moment-là. Je pense que c'est trop difficile pour les débutants qui n'ont fait que la compétition titanesque, mais je travaille sur la compétition avec la détermination que je ne peux que m'améliorer en le faisant.
Beaucoup de gens ont dit que participer réellement au concours serait le meilleur apprentissage. Je manque encore de connaissances, mais j'aimerais participer activement à la compétition et gagner des médailles.
** 1. Garder ma motivation élevée et continuer à étudier ** Pendant les deux premiers mois, j'ai eu beaucoup de choses que je ne comprenais pas, mais comme je m'y suis habitué, j'ai trouvé ça amusant d'étudier. J'ai également envisagé d'aller dans une école de programmation, mais j'apprends par moi-même parce que je ne pense pas qu'il soit logique d'aller dans une école de programmation pour ne pas être frustré.
** 2. Le fait que j'ai pu faire un plan et étudier de manière flexible sans faire un calendrier solide dès le début ** Comme je l'ai ressenti en écrivant cet article, les nouveaux ouvrages de référence sont à un rythme assez rapide dans le domaine de la science des données. De plus, il y a tant à apprendre, donc je ne pense pas que cela se déroulera comme prévu au début. J'étudiais donc en planifiant le mois en début de mois tout en étant conscient de l'ensemble de l'image sur la feuille de route.
** 1. J'ai trop essayé de perfectionner chacun d'eux ** En particulier, j'ai passé trop de temps sur la grammaire de base de python. L'inconvénient d'essayer d'être trop parfait ① Il faut du temps pour oublier les connaissances inutiles de toute façon ② Le taux de frustration augmente Etc.
** 2. L'équilibre entre théorie et pratique est mauvais ** Pour le moment, je sentais que je pourrais aimer étudier davantage en entrant la théorie et en la sortant. Les débutants ont tendance à avoir trop de contributions, je veux donc faire attention.
** 1. Difficile de continuer ** Surtout au cours des six premiers mois, j'ai souvent étudié environ 10 heures par jour, mais ma plus grande impression est que je ne me suis pas améliorée autant que je m'y attendais. J'ai senti qu'il serait impossible de continuer à apprendre pendant longtemps avec des motivations telles que «l'IA est l'ère à venir!» Et «l'apprentissage deee semble être cool». Je pense que même un livre destiné à ceux qui veulent devenir ingénieur en apprentissage automatique devrait procéder à un apprentissage basé sur le fait que ce n'est pas un domaine où les résultats sortiront immédiatement, car il est dit que vous devriez étudier pendant une longue période de 1 à 3 ans. pense. ..
** 2. Vous devez utiliser des matériaux bon marché! ** ** Tous les blogs présentés ci-dessus sont gratuits et Qiita a beaucoup de contenu utile pour l'apprentissage. Au moment de la vente, udemy peut acheter des cours de haute qualité pour 1 500 yens. Pour ceux qui envisagent de fréquenter une école de programmation, le cours d'intelligence artificielle et le cours de science des données de l'école de programmation sont assez chers, j'ai donc pensé qu'il était approprié de décider d'y assister après avoir appris les bases.
À l'avenir, j'aimerais faire de mon mieux avec ces deux éléments principaux. Merci d'avoir regardé jusqu'au bout!
Recommended Posts