1. Statistiques apprises avec Python 1-1. Statistiques de base (Pandas)

Divers termes sont utilisés dans les statistiques. Il y a beaucoup de choses qui sont très familières, comme les moyennes et les écarts, avec des choses que vous ne connaissez pas. Tout d'abord, je voudrais commencer par comprendre correctement la signification des termes de base. (En règle générale, écrivez le code et vérifiez le résultat sur Google Colaboratory)

** ⑴ Importez la bibliothèque utilisée pour le calcul numérique **

import numpy as np
import pandas as pd

** ⑵ Lire l'ensemble de données **

df = pd.read_csv("https://raw.githubusercontent.com/karaage0703/machine-learning-study/master/data/karaage_data.csv")

Le fichier csv spécifié dans ("nom de fichier") est lu à l'aide de la fonction read_csv de pandas et stocké dans la variable df.

** ⑶ Vérifiez le contenu des données **

df.head()

Seules les 5 premières lignes de données stockées dans la variable df par la fonction head sont affichées. 001_001_001.PNG

Vous pouvez voir que les données se composent de deux variables, x et y.

** ⑷ Calculez les statistiques de base **

df.describe()

La fonction pandas describe obtient une liste de statistiques de base. 001_001_002.PNG

Désormais, le terme ** statistiques ** est la valeur agrégée des données. En regardant les statistiques, vous pouvez connaître les caractéristiques de l'échantillon. Vérifions la signification de chacune des huit statistiques présentées comme statistiques de base.

Statistiques Variante x Variante y Signification des termes
count Nombre d'échantillons 6 6 n=Contient 6 ou 6 lignes de données au total
mean Valeur moyenne 14.33 3.33 Utilisé comme valeur dite représentative (valeur représentant un échantillon)
std écart-type 16.01 1.51 Abréviation de l'écart type, l'une des statistiques qui montre à quel point les données varient.
min valeur minimum 1.00 2.00 La plus petite valeur de la variable
25% 1er quadrant 2.75 2.25 Lorsque les données sont triées par ordre croissant, le nombre de données est compté du plus petit au premier trimestre.
50% Deuxième quadrant 7.50 3.00 Lorsque les données sont triées par ordre croissant, le nombre de données correspond au deuxième trimestre à partir du plus petit.
75% Troisième quadrant 23.50 3.75 Lorsque les données sont triées par ordre croissant, le nombre de données correspond au troisième trimestre à partir du plus petit.
max Valeur maximum 40.00 6.00 Plus grande valeur de la variable

** ⑸ Calculez les statistiques de base individuellement **

Tout d'abord, calculons la moyenne.

df.describe().loc['mean']

001_001_003.PNG

Ensuite, calculez l'écart type et le premier quadrant en spécifiant la statistique dans loc ['xxx'].

df.describe().loc['std']

001_001_004.PNG

df.describe().loc['25%']

001_001_005.PNG


Jusqu'à présent, nous avons examiné les statistiques de base à l'aide de Pandas. Ensuite, essayons de calculer diverses statistiques à l'aide de Numpy et considérons la méthode de calcul de base et les caractéristiques des statistiques.

Recommended Posts

1. Statistiques apprises avec Python 1-1. Statistiques de base (Pandas)
Statistiques avec python
1. Statistiques apprises avec Python 1-3. Calcul de diverses statistiques (statistiques)
Python Basic --Pandas, Numpy-
1. Statistiques apprises avec Python 1-2. Calcul de diverses statistiques (Numpy)
(Remarque) Statistiques de base sur Python et Pandas sur IBM DSX
1. Statistiques apprises avec Python 2-1. Distribution de probabilité [variable discrète]
Lire csv avec des pandas python
Application Python: Pandas Partie 1: Basique
Authentification BASIC avec bouteille Python
[Python] Utilisation d'OpenCV avec Python (basique)
[Python] Changer de type avec les pandas
[Python] [SQLite3] Exploiter SQLite avec Python (basique)
J'ai appris la grammaire de base de Python
Scraping avec Selenium en Python (Basic)
[Python] Programmation orientée objet apprise avec Pokemon
[Python] Joindre deux tables avec des pandas
Expérience d'apprentissage Perceptron apprise avec Python
Structure de données Python apprise avec la chimioinfomatique
Ramassage efficace du réseau avec Python
1. Statistiques apprises avec Python 2. Distribution des probabilités [Compréhension approfondie de scipy.stats]
[Python] Formater quand to_csv avec des pandas
Etude de base d'OpenCV avec Python
[Python] Extensions réactives apprises avec RxPY (3.0.1) [Rx]
Premiers pas avec python3 # 1 Apprenez les connaissances de base
Apprendre Python! Comparaison avec Java (fonction de base)
[Easy Python] Lecture de fichiers Excel avec des pandas
FizzBuzz en Python3
Grattage avec Python
RF Python Basic_01
Mes pandas (Python)
Grattage avec Python
Python avec Go
Twilio avec Python
Jouez avec 2016-Python
Testé avec Python
Écriture de base Python
avec syntaxe (Python)
Grammaire de base Python3
Bingo avec python
Zundokokiyoshi avec python
RF Python Basic_02
mémo pandas python
Excel avec Python
Micro-ordinateur avec Python
Cast avec python