Application Python: visualisation de données partie 1: basique

Cette fois, il se rapproche sérieusement de la méthode d'analyse des données. Je publierai sur la visualisation pour les clients.

Graphique

Il est également appelé un graphique statistique en japonais.

Informations qui ne peuvent pas être lues uniquement par des valeurs numériques Facilité de compréhension grâce à la visualisation, etc. Représenté par des graphiques et des figures.

Graphique linéaire

Tracer les données sur un plan Un graphique reliant les données tracées avec une ligne droite.

Utilisation: Convient pour visualiser la quantité qui change avec le temps et la position (distance). Exemple: en associant le temps à l'axe horizontal (axe x) et le volume des ventes de produits sur l'axe vertical (axe y) Vous pouvez visualiser la transition du volume des ventes.

image.png

graphique à barres

Un graphique dans lequel les éléments sont disposés sur l'axe horizontal et les valeurs prises par les éléments sont représentées verticalement par la longueur de la figure.

Utilisation: une bonne méthode de visualisation pour comparer les valeurs de deux éléments ou plus Exemple: Convient si vous souhaitez visualiser le nombre de votes obtenus par ordre du jour lors du vote.

image.png

histogramme

Également appelée carte de distribution de fréquence.

Après avoir divisé les données par classe, la fréquence au sein de la classe (le nombre de données contenues dans la même classe) est calculée. Graphique exprimé en hauteur

Utilisation: Distribution de données unidimensionnelles (telles que les données obtenues en mesurant plusieurs fois la longueur d'un produit) C'est la méthode de visualisation la plus appropriée pour la visualisation. Exemple: recensement par âge

image.png

Nuage de points

Un graphique avec des points correspondant respectivement à l'axe des x et à l'axe des y d'une certaine donnée.

Vous pouvez également visualiser un total de trois éléments sur un plan en utilisant la couleur et la taille des points.

Utilisation: Vérifiez si les données sont concentrées ou dépeuplées sur les données de deux éléments. Exemple: température maximale et nombre de glaçons vendus

image.png

diagramme circulaire

Un graphique qui attribue des angles du centre à des figures circulaires en fonction de la proportion de l'ensemble

Utilisation: la méthode de visualisation la plus appropriée lorsque vous souhaitez comparer le pourcentage d'un élément à l'ensemble. Exemple: pourcentage de tous les clients par âge, etc.

image.png

Génération aléatoire

la graine

Le PC génère un nombre aléatoire basé sur la "graine".

numpy.random.seed() #En spécifiant la même valeur de départ (entier) à chaque fois, la même séquence de nombres aléatoires sera générée à chaque exécution.

Dans les mêmes conditions, le même résultat de calcul peut être obtenu même si des nombres aléatoires sont utilisés. Par conséquent, il est utilisé pour la sortie qui nécessite une reproductibilité, comme lors du débogage.

Si vous ne définissez pas de valeur de départ, l'heure de l'ordinateur sera utilisée comme valeur initiale. Génère une séquence différente de nombres aléatoires à chaque fois que vous l'exécutez.

Générer des nombres aléatoires qui suivent une distribution normale

numpy.random.randn() 

Par le programme ci-dessus L'histogramme qui trace les valeurs numériques générées est basé sur une expression appelée distribution normale. Il a une forme similaire au graphique dessiné.

Le graphique de la distribution normale est le plus élevé au centre, Il a une forme de cloche symétrique qui descend des deux côtés. La valeur moyenne arrive à la position la plus élevée au centre.

Si vous spécifiez un entier dans numpy.random.randn () Renvoie des nombres aléatoires selon la distribution normale pour le nombre de valeurs entières spécifiées.

Générer des nombres aléatoires qui suivent une distribution binomiale

numpy.random.binomial()

Le programme ci-dessus renvoie une tentative réussie ou infructueuse. Par exemple, lorsque vous lancez une pièce, vous n'obtenez toujours que le recto ou le verso. La probabilité d'échec et de succès est de 0,5. Essayez comme ça

Il s’appelle le procès de Bernoulli.

Lors de la réalisation de n essais Bernoulli indépendants Distribution de probabilité du nombre de fois qu'un événement se produit

C'est ce qu'on appelle une distribution binomiale.

Si vous spécifiez l'entier n et le nombre réel p entre 0 et 1 dans numpy.random.binomial () Essayez le taux de réussite p autant de fois que l'entier n spécifié Renvoie le nombre de succès.

En d'autres termes, la distribution binomiale avec le nombre d'essais n et la probabilité p est calculée.

Si vous spécifiez une valeur entière pour le troisième argument, les premier et deuxième essais d'ensemble seront exécutés. Renvoie le nombre de valeurs entières.

#Lorsque vous souhaitez afficher le nombre de fois où le tableau apparaît 10000 fois lorsque vous lancez une pièce 100 fois
#Décrivez comme suit.

import numpy

numpy.random.binomial(100, 0.5, 10000)
# (Nombre d'essais,確率、Nombre d'essaisのセット数)

#Résultat de sortie
[52 51 61 ..., 57 53 52]

1.2.4 Sélectionner au hasard dans la liste

numpy.random.choice(x,n)

Si vous spécifiez des données de type liste x et une valeur entière n dans le programme ci-dessus Le résultat de la sélection aléatoire parmi les données de type de liste spécifiées x Renvoie le nombre de valeurs entières spécifiées n.

Données par ordre chronologique

type datetime (date et heure)

Lorsqu'il s'agit de données de séries chronologiques, nous avons besoin d'un moyen de représenter le temps.

datetime #Type de données qui gère la date et l'heure
datetime.datetime(year, month, day, hour=0, minute=0, second=0, microsecond=0)
#Si spécifié, retourne un objet datetime avec la date et l'heure spécifiées.
#Année(year),Mois(month),Journée(day)Est obligatoire. D'autres arguments peuvent être omis, sinon ce sera 0.

Il est obligatoire de spécifier l'année, le mois et le jour. D'autres arguments peuvent être omis, sinon ce sera 0.

type timedelta (transition de temps)

datetime.timedelta #Un type de données qui représente le temps écoulé et le décalage horaire.
datetime.timedelta(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0) 
#Si spécifié, retourne un objet timedelta avec l'heure spécifiée.
#Tous les arguments peuvent être omis, sinon ce sera 0.
import datetime

td = datetime.timedelta(days=1, seconds=2, microseconds=3, milliseconds=4, minutes=5, hours=6, weeks=7)
print(td)
#Résultat de sortie
50 days, 6:05:02.004003
#Vous pouvez également spécifier un nombre négatif.

td = datetime.timedelta(days=-1, hours=-10)
print(td)
#Résultat de sortie
-2 days, 14:00:00

Types d'opérations Datetime et timedelta

En trouvant la différence entre les objets datetime Vous pouvez comparer la date et l'heure.

Le résultat est obtenu avec un objet timedelta. De même, il est possible d'effectuer des opérations entre des objets timedelta. Encore une fois, vous pouvez obtenir des résultats avec un objet timedelta.

En ajoutant ou en soustrayant avec l'objet timedelta, il est possible d'obtenir facilement le nombre de jours et d'heures jusqu'à la date et l'heure définies.

import datetime

d1 = datetime.datetime.now()
d2 = datetime.datetime(2019, 9, 20, 19, 45, 0)
td = d2 - d1
print(td)
print(type(td))
#Résultat de sortie
243 days, 5:38:45.159115
<class 'datetime.timedelta'>

Créer un objet datetime à partir d'une chaîne représentant l'heure

strptime() 
#Génère et renvoie un objet datetime à partir d'une chaîne.
#À ce stade, vous devez spécifier le code de formatage correspondant à la chaîne d'origine.

Pour plus de détails sur le code de formatage, rendez-vous sur le site officiel de Python

datetime 
#Type de date de base et type d'heure ・ strftime()Et strptime()Comportement
import datetime

s = "2017-12-20 10:00:00"
str_dt = datetime.datetime.strptime(s, "%Y-%m-%d %H:%M:%S")
print(str_dt)
print(type(str_dt))
#Résultat de sortie
2017-12-20 10:00:00
<class 'datetime.datetime'>
import datetime as dt

#Une chaîne représentant le 22 octobre 1992"Année-Mois-journée"Affecter à la variable s sous la forme de
s = "1992-10-22"
# -Inscrivez-vous séparément par

#Convertissez la variable s en un objet datetime représentant le 22 octobre 1992 et affectez-le à la variable x
x = dt.datetime.strptime(s, "%Y-%m-%d")
#Convertir en date avec strptime

#production
print(x)

1992-10-22 00:00:00

Manipuler des données

Conversion de type du type chaîne en type numérique

Pour calculer la valeur numérique lue à partir d'un fichier, etc. Le type des données lues doit être de type int ou de type float. Vous pouvez convertir des chaînes de nombres uniquement en int () ou float () pour les convertir en types numériques.

Générer une séquence de nombres uniformément espacée 1

numpy.arange() 
#Lorsque vous souhaitez ordonner les éléments de la liste ou même des colonnes(0, 2, 4, ...)Quand tu veux avoir
numpy.arange(Valeur de départ,Valeur finale,Valeur d'intervalle)
#Si spécifié, la valeur de début à la valeur de fin-Renvoie des nombres jusqu'à 1 à des intervalles spécifiés.

np.arange(0, 5, 2) #Lorsque vous souhaitez obtenir une colonne paire de 0 à 4
np.arange(0, 4, 2) #Notez que si spécifié, ce sera une colonne paire de 0 à 2.

Générer une séquence de nombres uniformément espacée 2

numpy.linspace() #Lorsque vous souhaitez diviser la plage spécifiée dans le nombre spécifié
numpy.linspace(Valeur de départ,Valeur finale,Valeur du nombre que vous souhaitez diviser)
#Si spécifié, retourne les points à diviser en nombre spécifié.

np.linspace(0, 15, 4) 
#4 points qui divisent la plage de 0 à 15 à intervalles égaux 0, 5, 10,Si vous voulez obtenir 15

Recommended Posts

Application Python: visualisation de données partie 1: basique
Application de Python: visualisation de données Partie 3: divers graphiques
Application Python: Pandas Partie 1: Basique
Application Python: visualisation de données, partie 2: matplotlib
Application de Python: Nettoyage des données Partie 1: Notation Python
Application Python: Traitement des données # 3: Format des données
Bibliothèques de visualisation de données Python
Mémorandum de base Python partie 2
Mémo de base Python - Partie 2
Mémo de base Python - Partie 1
Application de Python: Traitement des données Partie 2: Analyse de divers formats de données
Application Python: Pandas Partie 2: Série
Mémo de grammaire de base Python (1)
Application Python: Traitement des données Partie 1: Formatage des données et entrée / sortie de fichier
Application Python: Numpy Partie 3: Double tableau
Visualisez facilement vos données avec Python seaborn.
Analyse de données à partir de python (visualisation de données 1)
Analyse de données à partir de python (visualisation de données 2)
Application de Python: Nettoyage des données Partie 2: Nettoyage des données à l'aide de DataFrame
Outil de visualisation Python pour le travail d'analyse de données
Traiter les données Pubmed .xml avec python [Partie 2]
Application de Python: Pandas Partie 4: Concaténation et combinaison de DataFrames
[Python] Application Web à partir de 0! Pratique (4) - Mise en forme des données-
Recommandation d'Altair! Visualisation des données avec Python
Mémorandum de base Python Partie 3-A propos de l'orientation des objets-
QGIS + Python Partie 2
QGIS + Python Partie 1
Écriture de base Python
Python: grattage partie 1
Grammaire de base Python3
Python3 commence la partie 1
[python] Lecture de données
Python: grattage, partie 2
Créez des données de test comme ça avec Python (partie 1)
Visualisation en temps réel des données thermographiques AMG8833 en Python
Techniques de visualisation de base apprises à partir des données de Kaggle Titanic
Acquisition de données à partir de l'API d'analyse avec l'application Web Client API Google pour python Partie 2
Un beau dessin graphique avec Python -seaborn facilite l'analyse et la visualisation des données Partie 1
Un beau dessin graphique avec Python -seaborn facilite l'analyse et la visualisation des données Partie 2
Analyse de données avec python 2
Cours de base Python (12 fonctions)
Édition de base Python Memo
Cours de base Python (7 dictionnaire)
Cours de base Python (2 installation Python)
Mémo de visualisation par Python
Présentation de l'analyse de données python
[python] méthode de base de la classe
Cours de base Python (11 exceptions)
Divers outils de visualisation Python
Nettoyage des données à l'aide de Python
Aide-mémoire Python3 (basique)
"My Graph Generation Application" par Python (PySide + PyQtGraph) Partie 2
Grammaire de base Python (divers)
Cours de base Python (Introduction)
Application Web réalisée avec Python3.4 + Django (Construction de l'environnement Part.1)
python basic ② sous windows
Visualisation des données avec les pandas