Machine Learning ML, statistiques, science des données. Tous ces mots sont souvent entendus en raison de la propagation rapide de l'IA ces dernières années, mais quelle est la différence entre eux? Il n'y a pas de réponse définitive, mais pour le dire simplement, ** la science des données est un domaine qui combine des domaines spécialisés tels que les statistiques, l'informatique et les affaires **. Il sera plus facile à comprendre si vous regardez la figure ci-dessous. Actuellement, les data scientists sont actifs dans divers domaines et leur adoption se développe dans diverses entreprises, des compagnies d'assurance aux sociétés de ressources humaines et aux cabinets de conseil. Tous les domaines sont communs en ce sens qu'ils analysent à l'aide de données et de connaissances spécialisées et expliquent les résultats de l'analyse. D'autre part, l'apprentissage automatique peut être considéré comme l'intersection des statistiques et de l'informatique dans la science des données. Les points de résolution de problèmes à l'aide de ** données en statistiques et de résolution de problèmes à l'aide d'algorithmes ** en informatique s'appliquent également à l'apprentissage automatique. D'autre part, dans l'apprentissage automatique, nous nous concentrons sur ** la façon dont les résultats s'appliquent **, dans les statistiques, nous nous concentrons sur ** l'exactitude mathématique ** et en informatique ** la rapidité et la précision de traitement. Je me concentrerai principalement sur la possibilité de le faire **.
Les méthodes d'apprentissage automatique peuvent être globalement divisées en trois types: «apprentissage supervisé», «apprentissage non supervisé» et «apprentissage amélioré». L '«apprentissage supervisé» et «l'apprentissage non supervisé» ont en commun que les données données sont entraînées par une machine pour obtenir une sortie. Par contre, en "apprentissage supervisé", ** les données données sont accompagnées d'un libellé indiquant si la réponse est correcte à l'avance par l'homme **, alors qu'en "apprentissage non supervisé", ** les données données sont Puisqu'il ne contient pas d'informations indiquant si la réponse est correcte ou non **, la classification déterminée par la machine est le résultat final. Dans le "renforcement de l'apprentissage", une évaluation (récompense) est donnée à la sortie des données d'entrée, et l'apprentissage se déroule en conséquence. «Renforcer l'apprentissage» a des applications relativement limitées telles que les robots marcheurs et les jeux de shogi. L'apprentissage supervisé / non supervisé est divisé en «problèmes de classification» et «problèmes de retour». Dans le "problème de classification", le résultat de classification de 1 ou 0 est sorti comme sortie, tandis que dans le "problème de régression", des données numériques continues sont sorties comme sortie. Il existe différents modèles de calcul des données de sortie à partir des données d'entrée.
Recommended Posts