Début des études: samedi 7 décembre
Matériel pédagogique, etc.: ・ Miyuki Oshige "Détails! Note d'introduction à Python3 »(Sotech, 2017): 19/12 (jeudi) Terminé ・ Cours Progate Python (5 cours au total): se termine le samedi 21 décembre ・ Andreas C. Müller, Sarah Guido "(titre japonais) Apprentissage automatique à partir de Python" (O'Reilly Japon, 2017): Terminé le samedi 23 décembre ・ Kaggle: Real or Not? NLP with Disaster Tweets: Publié du samedi 28 décembre au vendredi 3 janvier Ajustement ・ ** Wes Mckinney "(titre japonais) Introduction à l'analyse des données par Python" (O'Reilly Japan, 2018) **: 4 janvier (sam) ~
p.134 Terminer la lecture du Chapitre 4 Bases de Numpy.
-NumPy (Python numérique): interprété au sens de Python numérique Calcul et manipulation de données à grande vitesse à l'aide de la notation de vectorisation Il ne peut pas gérer les méthodes de modélisation et d'analyse mathématiques, mais il devient une arme lors de l'utilisation d'outils orientés tableau tels que les pandas en le maîtrisant. Sert d'interface avec les langages de bas niveau tels que C et Fortran
・ Ndarray: objet de tableau à N dimensions, contribuant au traitement des données rapide et flexible dans l'environnement Python Généré par tableau, le type de données estimé est utilisé, mais le type de données peut être spécifié par dtype. La conversion de type (cast) est possible avec un type.
-En utilisant l'opération vectorielle, il n'est pas nécessaire d'écrire un type de boucle. (= Fonctionnement à grande vitesse)
・ Tranchage (coupe / extraction de certains éléments) Les tranches d'un tableau bidimensionnel sont découpées le long de l'axe. (Légèrement différent des tranches de tableaux multidimensionnels.) Lorsque la tranche est mélangée avec un scalaire, la dimension diminue. Vous pouvez bien le comprendre en le prenant avec forme. (3,) → 3 éléments. (1, 3) → matrice 1x3. P.108
・ Tableau de valeurs de vérité unidimensionnel L'affectation numérique, etc. n'est possible que pour ceux spécifiés par ndarray (ceux qui sont vrais) data [names! = 'A'] = 7 Remplacez 7 uniquement pour ceux dont les noms ne sont pas A, etc. Ce type d'opération est souvent utilisé dans l'environnement des pandas.
・ Calcul du produit intérieur à l'aide de la matrice d'atterrissage (np.dot) L'atterrissage se fait en .T. Calculez le produit interne de X avec X.T.dot (X). Le remplacement partiel de la matrice est également possible en donnant l'ordre des axes à l'argument de transposer.
・ Ufunc à terme unique (abs, sqrt, log ...), ufunc binaire (addition, division, maximum ...)
-Vous pouvez effectuer des opérations vectorielles sur l'opérateur ternaire de python A if condition else y à np.where. Définissez le jugement de vérité (expression conditionnelle) dans le premier argument, True dans le deuxième argument et False dans le troisième argument, et renvoyez le correspondant.
・ La dimension peut être réduite par un traitement d'agrégation (fonction statistique) comme la somme et la moyenne
-Une fonction set telle que np.unique peut trier et afficher les valeurs du tableau après avoir supprimé les doublons. (Comme utilisé dans le prétraitement Kaggle)
-L'algèbre linéaire peut être calculée avec le module np.linalg. Expression matricielle, matrice inverse pour matrice carrée, décomposition QR ...
・ Np.random permet un calcul basé sur différents types de distributions de probabilité. Distribution binaire, distribution normale ... Il est fourni en complément du random intégré de Python.
Recommended Posts