Cette fois, il se rapproche sérieusement de la méthode d'analyse des données. Je publierai sur la visualisation pour les clients.
Il est également appelé un graphique statistique en japonais.
Informations qui ne peuvent pas être lues uniquement par des valeurs numériques Facilité de compréhension grâce à la visualisation, etc. Représenté par des graphiques et des figures.
Tracer les données sur un plan Un graphique reliant les données tracées avec une ligne droite.
Utilisation: Convient pour visualiser la quantité qui change avec le temps et la position (distance). Exemple: en associant le temps à l'axe horizontal (axe x) et le volume des ventes de produits sur l'axe vertical (axe y) Vous pouvez visualiser la transition du volume des ventes.
Un graphique dans lequel les éléments sont disposés sur l'axe horizontal et les valeurs prises par les éléments sont représentées verticalement par la longueur de la figure.
Utilisation: une bonne méthode de visualisation pour comparer les valeurs de deux éléments ou plus Exemple: Convient si vous souhaitez visualiser le nombre de votes obtenus par ordre du jour lors du vote.
Également appelée carte de distribution de fréquence.
Après avoir divisé les données par classe, la fréquence au sein de la classe (le nombre de données contenues dans la même classe) est calculée. Graphique exprimé en hauteur
Utilisation: Distribution de données unidimensionnelles (telles que les données obtenues en mesurant plusieurs fois la longueur d'un produit) C'est la méthode de visualisation la plus appropriée pour la visualisation. Exemple: recensement par âge
Un graphique avec des points correspondant respectivement à l'axe des x et à l'axe des y d'une certaine donnée.
Vous pouvez également visualiser un total de trois éléments sur un plan en utilisant la couleur et la taille des points.
Utilisation: Vérifiez si les données sont concentrées ou dépeuplées sur les données de deux éléments. Exemple: température maximale et nombre de glaçons vendus
Un graphique qui attribue des angles du centre à des figures circulaires en fonction de la proportion de l'ensemble
Utilisation: la méthode de visualisation la plus appropriée lorsque vous souhaitez comparer le pourcentage d'un élément à l'ensemble. Exemple: pourcentage de tous les clients par âge, etc.
Le PC génère un nombre aléatoire basé sur la "graine".
numpy.random.seed() #En spécifiant la même valeur de départ (entier) à chaque fois, la même séquence de nombres aléatoires sera générée à chaque exécution.
Dans les mêmes conditions, le même résultat de calcul peut être obtenu même si des nombres aléatoires sont utilisés. Par conséquent, il est utilisé pour la sortie qui nécessite une reproductibilité, comme lors du débogage.
Si vous ne définissez pas de valeur de départ, l'heure de l'ordinateur sera utilisée comme valeur initiale. Génère une séquence différente de nombres aléatoires à chaque fois que vous l'exécutez.
numpy.random.randn()
Par le programme ci-dessus L'histogramme qui trace les valeurs numériques générées est basé sur une expression appelée distribution normale. Il a une forme similaire au graphique dessiné.
Le graphique de la distribution normale est le plus élevé au centre, Il a une forme de cloche symétrique qui descend des deux côtés. La valeur moyenne arrive à la position la plus élevée au centre.
Si vous spécifiez un entier dans numpy.random.randn () Renvoie des nombres aléatoires selon la distribution normale pour le nombre de valeurs entières spécifiées.
numpy.random.binomial()
Le programme ci-dessus renvoie une tentative réussie ou infructueuse. Par exemple, lorsque vous lancez une pièce, vous n'obtenez toujours que le recto ou le verso. La probabilité d'échec et de succès est de 0,5. Essayez comme ça
Il s’appelle le procès de Bernoulli.
Lors de la réalisation de n essais Bernoulli indépendants Distribution de probabilité du nombre de fois qu'un événement se produit
C'est ce qu'on appelle une distribution binomiale.
Si vous spécifiez l'entier n et le nombre réel p entre 0 et 1 dans numpy.random.binomial () Essayez le taux de réussite p autant de fois que l'entier n spécifié Renvoie le nombre de succès.
En d'autres termes, la distribution binomiale avec le nombre d'essais n et la probabilité p est calculée.
Si vous spécifiez une valeur entière pour le troisième argument, les premier et deuxième essais d'ensemble seront exécutés. Renvoie le nombre de valeurs entières.
#Lorsque vous souhaitez afficher le nombre de fois où le tableau apparaît 10000 fois lorsque vous lancez une pièce 100 fois
#Décrivez comme suit.
import numpy
numpy.random.binomial(100, 0.5, 10000)
# (Nombre d'essais,確率、Nombre d'essaisのセット数)
#Résultat de sortie
[52 51 61 ..., 57 53 52]
numpy.random.choice(x,n)
Si vous spécifiez des données de type liste x et une valeur entière n dans le programme ci-dessus Le résultat de la sélection aléatoire parmi les données de type de liste spécifiées x Renvoie le nombre de valeurs entières spécifiées n.
Lorsqu'il s'agit de données de séries chronologiques, nous avons besoin d'un moyen de représenter le temps.
datetime #Type de données qui gère la date et l'heure
datetime.datetime(year, month, day, hour=0, minute=0, second=0, microsecond=0)
#Si spécifié, retourne un objet datetime avec la date et l'heure spécifiées.
#Année(year),Mois(month),Journée(day)Est obligatoire. D'autres arguments peuvent être omis, sinon ce sera 0.
Il est obligatoire de spécifier l'année, le mois et le jour. D'autres arguments peuvent être omis, sinon ce sera 0.
datetime.timedelta #Un type de données qui représente le temps écoulé et le décalage horaire.
datetime.timedelta(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0)
#Si spécifié, retourne un objet timedelta avec l'heure spécifiée.
#Tous les arguments peuvent être omis, sinon ce sera 0.
import datetime
td = datetime.timedelta(days=1, seconds=2, microseconds=3, milliseconds=4, minutes=5, hours=6, weeks=7)
print(td)
#Résultat de sortie
50 days, 6:05:02.004003
#Vous pouvez également spécifier un nombre négatif.
td = datetime.timedelta(days=-1, hours=-10)
print(td)
#Résultat de sortie
-2 days, 14:00:00
En trouvant la différence entre les objets datetime Vous pouvez comparer la date et l'heure.
Le résultat est obtenu avec un objet timedelta. De même, il est possible d'effectuer des opérations entre des objets timedelta. Encore une fois, vous pouvez obtenir des résultats avec un objet timedelta.
En ajoutant ou en soustrayant avec l'objet timedelta, il est possible d'obtenir facilement le nombre de jours et d'heures jusqu'à la date et l'heure définies.
import datetime
d1 = datetime.datetime.now()
d2 = datetime.datetime(2019, 9, 20, 19, 45, 0)
td = d2 - d1
print(td)
print(type(td))
#Résultat de sortie
243 days, 5:38:45.159115
<class 'datetime.timedelta'>
strptime()
#Génère et renvoie un objet datetime à partir d'une chaîne.
#À ce stade, vous devez spécifier le code de formatage correspondant à la chaîne d'origine.
Pour plus de détails sur le code de formatage, rendez-vous sur le site officiel de Python
datetime
#Type de date de base et type d'heure ・ strftime()Et strptime()Comportement
import datetime
s = "2017-12-20 10:00:00"
str_dt = datetime.datetime.strptime(s, "%Y-%m-%d %H:%M:%S")
print(str_dt)
print(type(str_dt))
#Résultat de sortie
2017-12-20 10:00:00
<class 'datetime.datetime'>
import datetime as dt
#Une chaîne représentant le 22 octobre 1992"Année-Mois-journée"Affecter à la variable s sous la forme de
s = "1992-10-22"
# -Inscrivez-vous séparément par
#Convertissez la variable s en un objet datetime représentant le 22 octobre 1992 et affectez-le à la variable x
x = dt.datetime.strptime(s, "%Y-%m-%d")
#Convertir en date avec strptime
#production
print(x)
1992-10-22 00:00:00
Pour calculer la valeur numérique lue à partir d'un fichier, etc. Le type des données lues doit être de type int ou de type float. Vous pouvez convertir des chaînes de nombres uniquement en int () ou float () pour les convertir en types numériques.
numpy.arange()
#Lorsque vous souhaitez ordonner les éléments de la liste ou même des colonnes(0, 2, 4, ...)Quand tu veux avoir
numpy.arange(Valeur de départ,Valeur finale,Valeur d'intervalle)
#Si spécifié, la valeur de début à la valeur de fin-Renvoie des nombres jusqu'à 1 à des intervalles spécifiés.
np.arange(0, 5, 2) #Lorsque vous souhaitez obtenir une colonne paire de 0 à 4
np.arange(0, 4, 2) #Notez que si spécifié, ce sera une colonne paire de 0 à 2.
numpy.linspace() #Lorsque vous souhaitez diviser la plage spécifiée dans le nombre spécifié
numpy.linspace(Valeur de départ,Valeur finale,Valeur du nombre que vous souhaitez diviser)
#Si spécifié, retourne les points à diviser en nombre spécifié.
np.linspace(0, 15, 4)
#4 points qui divisent la plage de 0 à 15 à intervalles égaux 0, 5, 10,Si vous voulez obtenir 15
Recommended Posts