Application Python: Pandas Partie 2: Série

De la suite de la dernière fois

Je publierai une série qui traite des tableaux à 1 dimension.

Génération en série

Fondamentalement, c'est la même chose que Numpy, importez des Pandas, renommez-les et utilisez-les.

import pandas as pd
#Introduction de pandas avec import
#les pandas peuvent maintenant être manipulés par pd avec as.

L'une des structures de données de Pandas, Series, peut être traitée comme un tableau unidimensionnel.

Vous pouvez générer une série en passant une liste de type dictionnaire sous la forme de pd.Series (liste de type dictionnaire).

Vous pouvez également générer une série en spécifiant les données et l'index qui lui sont associés.

pd.Series(Tableau de données, index=Tableau d'index) #Précisez dans ce format.

Si aucun index n'est spécifié, les entiers seront automatiquement ajoutés en tant qu'index dans l'ordre croissant à partir de 0.

Lorsque vous sortez Series

dtype: int64

Bien qu'il soit sorti comme ci-dessus Indique que la valeur stockée dans Series est du type de données "int64". dtype signifie «Type de données» et fait référence au type de données. (Si la donnée est un entier, "int", si elle a un point décimal, "float", etc.)

int64 est un entier d'une taille de 64 bits, de −263−263 à 263-1263-1. Il peut gérer des entiers.

D'autres dtypes, tels que int32, ont le même entier mais des tailles différentes. Par exemple, le type booléen n'a que 0 ou 1 comme valeur.

import pandas as pd

fruits = {"banana": 3, "orange": 2}
print(pd.Series(fruits))
#Résultat de sortie
banana    3
orange    2
dtype: int64

Série (majuscule)

Lorsqu'il s'agit de pd, nous utilisons la méthode Series Notez que la tête est capitalisée comme S.

référence

Lors du référencement d'éléments de la série Comment spécifier le numéro d'index Il existe un moyen de spécifier la valeur d'index.

En spécifiant la série [: 3] etc. comme la notation de tranche de la liste Vous pouvez récupérer n'importe quelle plage.

Reportez-vous aux valeurs d'index des éléments souhaités dans une liste. Si vous spécifiez une valeur entière au lieu d'une liste, vous ne pouvez récupérer que les données correspondant à cette position.

Dans le code ci-dessous, le numéro d'index est spécifié à l'aide de tranches et les données sont récupérées.

import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[0:2])

#Parce que l'ordre est conservé lors de la conversion en série
#À côté de la banane se trouve l'orange.
# (La version de Pandas est 0.23.S'il est avant 0,
#Puisque les clés sont triées par ordre croissant, l'ordre alphabétique après la banane est le raisin.)

#Résultat de sortie
banana    3
orange    4

#Le code ci-dessous récupère les données en spécifiant les valeurs d'index dans une liste.

import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]])
#Résultat de sortie
orange    4
peach     5
#Le code ci-dessous spécifie le numéro d'index et récupère une seule donnée.

import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[3])
#Résultat de sortie
5

Remarque: liste des valeurs d'index

Lors de la spécification de la valeur d'index, comme indiqué ci-dessous Doit être spécifié entre doubles parenthèses

[[]]

#Exemple
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]]) #Faites attention ici

Extraire les données et indexer

Il existe une méthode pour récupérer uniquement la valeur de données de la série créée ou uniquement l'index.

Valeurs de données (series.values)

import pandas as pd

index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.values)
#Résultat de sortie
[11  4 10]

Référence d'index (series.index)

Pour référence d'index

import pandas as pd

index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.index)
#Résultat de sortie
Index(['soccer', 'tennis', 'basketball'], dtype='object')

Ajouter un élément

Lors de l'ajout d'un élément à une série, l'élément à ajouter doit également être de type Series.

Convertissez à l'avance l'élément que vous souhaitez ajouter au type Série

Il peut être ajouté en utilisant le nom de variable .append () du type Series de la destination d'ajout.

import pandas as pd

fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
print(series)
#Résultat de sortie
banana    3
orange    2
dtype: int64

#La série ci-dessus est omise
grape = {"grape": 3}
series = series.append(pd.Series(grape))
print(series)
#Résultat de sortie
banana    3
orange    2
grape     3
dtype: int64

#Vous pouvez également l'ajouter en écrivant comme suit sans convertir au préalable.

series = series.append(pd.Series([3], index=["grape"]))

Déposer un élément (.drop)

Vous pouvez supprimer un élément à l'aide de la référence d'index Series.

Lorsque la variable de type série est série

series.drop("Valeur d'index")
#Vous pouvez maintenant supprimer l'élément avec la valeur d'index spécifiée.
fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
series= series.drop("banana")
#Résultat de sortie
orange    2

filtration

Vous souhaiterez peut-être extraire des éléments qui correspondent aux conditions des données de type Série.

Dans Pandas, si vous spécifiez une séquence de type booléen Seuls les vrais peuvent être extraits.

Une séquence est un «ordre» ou «continu».

import pandas as pd

index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)

conditions = [True, True, False, False, False]
print(series[conditions])
#Résultat de sortie
apple     10
orange     5

J'ai créé une séquence de type booléen ici, Dans Pandas, lorsque vous créez une expression conditionnelle à l'aide de Series (ou DataFrame) Vous pouvez obtenir une séquence de type booléen.

Élément conditionnel uniquement

series[series >= 5]

Si vous spécifiez comme ci-dessus Vous ne pouvez obtenir que des éléments d'une valeur supérieure ou égale à 5.

ET condition

#En cas de condition ET
series[ ][ ] #[ ]Spécifiez la condition AND en organisant plusieurs
series[(Condition 1)&(Condition 2)]

OU condition

#Pour les conditions OU
series[(Condition 1)|(Condition 2)]
# (conditions)À|Connectez-vous avec (course).

Trier

Dans Series, vous pouvez trier respectivement les index et les données. Lorsque la variable de type série est série

series.sort_index() #Tri d'index
series.sort_values() #Tri des données

Sauf indication contraire, il sera trié par ordre croissant. En passant ce qui suit comme argument, ce sera dans l'ordre décroissant.

ascending=False #En passant cela, il sera trié par ordre décroissant.
#Trier par ordre croissant
import pandas as pd

index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)

items1 = series.sort_index()
print(items1)
#Résultat de sortie
apple         10
banana         8
kiwifruit      3
orange         5
strawberry    12
#Trier par ordre décroissant
items2 = series.sort_values(ascending=False)
print(items2)
#Résultat de sortie
strawberry    12
apple         10
banana         8
orange         5
kiwifruit      3

Recommended Posts

Application Python: Pandas Partie 2: Série
Application Python: Pandas Partie 1: Basique
série pandas partie 1
Application de Python: Pandas Partie 4: Concaténation et combinaison de DataFrames
Application Python: Pandas # 3: Dataframe
Application de Python: Nettoyage des données Partie 1: Notation Python
Application Python: Traitement des données # 3: Format des données
[Python] Comment utiliser la série Pandas
Application Python: Numpy Partie 3: Double tableau
Application Python: visualisation de données partie 1: basique
QGIS + Python Partie 2
[Python] Qu'est-ce que la série pandas et DataFrame?
Mes pandas (Python)
Application de Python: visualisation de données Partie 3: divers graphiques
QGIS + Python Partie 1
Python: grattage partie 1
Ajouter une série à la colonne dans les pandas python
mémo pandas python
Python3 commence la partie 1
Python: grattage, partie 2
Application de Python: Traitement des données Partie 2: Analyse de divers formats de données
Fonctionnement de base de Python Pandas Series et Dataframe (1)
Python: analyse des séries chronologiques
Question sur la série chronologique Python
Installer des pandas sur python2.6
Mémorandum de base Python partie 2
Mémo de base Python - Partie 2
[Formation Python partie 3] Convertissez les pandas DataFrame, Series et Standard List entre eux
Mémo de base Python - Partie 1
Application de Python 3 vars
Python Basic --Pandas, Numpy-
"My Graph Generation Application" par Python (PySide + PyQtGraph) Partie 2
Application Web réalisée avec Python3.4 + Django (Construction de l'environnement Part.1)
"My Graph Generation Application" par Python (PySide + PyQtGraph) Partie 1
Introduction à Python numpy pandas matplotlib (pour ~ B3 ~ part2)
Processus d'application de la fonction pandas illustré
Etudier Python avec freeCodeCamp part1
Lire csv avec des pandas python
Images en bordure avec python Partie 1
Série Python 2 et série 3 (édition Anaconda)
Grattage avec Selenium + Python Partie 1
Python: prévision de survie de navire, partie 2
[Python] Convertir la liste en Pandas [Pandas]
Espace d'en-tête de bande de pandas Python
Python: Apprentissage supervisé: Hyper Paramètres Partie 1
Mémo de grammaire de base Python (1)
Python: prévision de survie des navires, partie 1
Etudier Python avec freeCodeCamp part2
[Python] Changer de type avec les pandas
Application Python: Traitement des données Partie 1: Formatage des données et entrée / sortie de fichier
Traitement d'image avec Python (partie 1)
Installez pandas 0.14 sur python3.4 [sur Mac]
Application Python: visualisation de données, partie 2: matplotlib
Résolution de Nampre avec Python (partie 2)
Installation de la série Python 3 pour Mac