De la suite de la dernière fois
Je publierai une série qui traite des tableaux à 1 dimension.
Fondamentalement, c'est la même chose que Numpy, importez des Pandas, renommez-les et utilisez-les.
import pandas as pd
#Introduction de pandas avec import
#les pandas peuvent maintenant être manipulés par pd avec as.
L'une des structures de données de Pandas, Series, peut être traitée comme un tableau unidimensionnel.
Vous pouvez générer une série en passant une liste de type dictionnaire sous la forme de pd.Series (liste de type dictionnaire).
Vous pouvez également générer une série en spécifiant les données et l'index qui lui sont associés.
pd.Series(Tableau de données, index=Tableau d'index) #Précisez dans ce format.
Si aucun index n'est spécifié, les entiers seront automatiquement ajoutés en tant qu'index dans l'ordre croissant à partir de 0.
Lorsque vous sortez Series
dtype: int64
Bien qu'il soit sorti comme ci-dessus Indique que la valeur stockée dans Series est du type de données "int64". dtype signifie «Type de données» et fait référence au type de données. (Si la donnée est un entier, "int", si elle a un point décimal, "float", etc.)
int64 est un entier d'une taille de 64 bits, de −263−263 à 263-1263-1. Il peut gérer des entiers.
D'autres dtypes, tels que int32, ont le même entier mais des tailles différentes. Par exemple, le type booléen n'a que 0 ou 1 comme valeur.
import pandas as pd
fruits = {"banana": 3, "orange": 2}
print(pd.Series(fruits))
#Résultat de sortie
banana 3
orange 2
dtype: int64
Lorsqu'il s'agit de pd, nous utilisons la méthode Series Notez que la tête est capitalisée comme S.
Lors du référencement d'éléments de la série Comment spécifier le numéro d'index Il existe un moyen de spécifier la valeur d'index.
En spécifiant la série [: 3] etc. comme la notation de tranche de la liste Vous pouvez récupérer n'importe quelle plage.
Reportez-vous aux valeurs d'index des éléments souhaités dans une liste. Si vous spécifiez une valeur entière au lieu d'une liste, vous ne pouvez récupérer que les données correspondant à cette position.
Dans le code ci-dessous, le numéro d'index est spécifié à l'aide de tranches et les données sont récupérées.
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[0:2])
#Parce que l'ordre est conservé lors de la conversion en série
#À côté de la banane se trouve l'orange.
# (La version de Pandas est 0.23.S'il est avant 0,
#Puisque les clés sont triées par ordre croissant, l'ordre alphabétique après la banane est le raisin.)
#Résultat de sortie
banana 3
orange 4
#Le code ci-dessous récupère les données en spécifiant les valeurs d'index dans une liste.
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]])
#Résultat de sortie
orange 4
peach 5
#Le code ci-dessous spécifie le numéro d'index et récupère une seule donnée.
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[3])
#Résultat de sortie
5
Lors de la spécification de la valeur d'index, comme indiqué ci-dessous Doit être spécifié entre doubles parenthèses
[[]]
#Exemple
import pandas as pd
fruits = {"banana": 3, "orange": 4, "grape": 1, "peach": 5}
series = pd.Series(fruits)
print(series[["orange", "peach"]]) #Faites attention ici
Il existe une méthode pour récupérer uniquement la valeur de données de la série créée ou uniquement l'index.
import pandas as pd
index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.values)
#Résultat de sortie
[11 4 10]
Pour référence d'index
import pandas as pd
index = ["soccer", "tennis", "basketball"]
data = [11, 4, 10]
series = pd.Series(data, index=index)
print(series.index)
#Résultat de sortie
Index(['soccer', 'tennis', 'basketball'], dtype='object')
Lors de l'ajout d'un élément à une série, l'élément à ajouter doit également être de type Series.
Convertissez à l'avance l'élément que vous souhaitez ajouter au type Série
Il peut être ajouté en utilisant le nom de variable .append () du type Series de la destination d'ajout.
import pandas as pd
fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
print(series)
#Résultat de sortie
banana 3
orange 2
dtype: int64
#La série ci-dessus est omise
grape = {"grape": 3}
series = series.append(pd.Series(grape))
print(series)
#Résultat de sortie
banana 3
orange 2
grape 3
dtype: int64
#Vous pouvez également l'ajouter en écrivant comme suit sans convertir au préalable.
series = series.append(pd.Series([3], index=["grape"]))
Vous pouvez supprimer un élément à l'aide de la référence d'index Series.
Lorsque la variable de type série est série
series.drop("Valeur d'index")
#Vous pouvez maintenant supprimer l'élément avec la valeur d'index spécifiée.
fruits = {"banana": 3, "orange": 2}
series = pd.Series(fruits)
series= series.drop("banana")
#Résultat de sortie
orange 2
Vous souhaiterez peut-être extraire des éléments qui correspondent aux conditions des données de type Série.
Dans Pandas, si vous spécifiez une séquence de type booléen Seuls les vrais peuvent être extraits.
Une séquence est un «ordre» ou «continu».
import pandas as pd
index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)
conditions = [True, True, False, False, False]
print(series[conditions])
#Résultat de sortie
apple 10
orange 5
J'ai créé une séquence de type booléen ici, Dans Pandas, lorsque vous créez une expression conditionnelle à l'aide de Series (ou DataFrame) Vous pouvez obtenir une séquence de type booléen.
series[series >= 5]
Si vous spécifiez comme ci-dessus Vous ne pouvez obtenir que des éléments d'une valeur supérieure ou égale à 5.
#En cas de condition ET
series[ ][ ] #[ ]Spécifiez la condition AND en organisant plusieurs
series[(Condition 1)&(Condition 2)]
#Pour les conditions OU
series[(Condition 1)|(Condition 2)]
# (conditions)À|Connectez-vous avec (course).
Dans Series, vous pouvez trier respectivement les index et les données. Lorsque la variable de type série est série
series.sort_index() #Tri d'index
series.sort_values() #Tri des données
Sauf indication contraire, il sera trié par ordre croissant. En passant ce qui suit comme argument, ce sera dans l'ordre décroissant.
ascending=False #En passant cela, il sera trié par ordre décroissant.
#Trier par ordre croissant
import pandas as pd
index = ["apple", "orange", "banana", "strawberry", "kiwifruit"]
data = [10, 5, 8, 12, 3]
series = pd.Series(data, index=index)
items1 = series.sort_index()
print(items1)
#Résultat de sortie
apple 10
banana 8
kiwifruit 3
orange 5
strawberry 12
#Trier par ordre décroissant
items2 = series.sort_values(ascending=False)
print(items2)
#Résultat de sortie
strawberry 12
apple 10
banana 8
orange 5
kiwifruit 3
Recommended Posts