[Python] Mémo d'opération de pandas DataFrame

introduction

Parce que j'ai eu l'opportunité d'analyser des données alors que j'étais débutant Je vais donc résumer les éléments grammaticaux du Python DataFrame nouvellement obtenu.

supposition

product.csv

id	name	price	category	isPopular
1	eraser	100	stationary	1
2	pencil	200	stationary	0
3	socks	400	clothes	1
4	pants	1000	clothes	0
5	apple	100	food	0

`analyze.py`


import pandas as pd

Extraire le type de valeur d'une colonne

df['category'].value_counts().index

Résultat d'exécution

Index(['stationery', 'clothes', 'food'], dtype='object')

Modifier / ajouter la valeur de DataFrame en spécifiant la condition

df.loc[df.name == 'socks', 'price'] = 500
df.loc[df.category == 'stationery', 'category_id'] = 0
df.loc[df.category == 'clothes', 'category_id'] = 1
df.loc[df.category == 'food', 'category_id'] = 2
df

Résultat d'exécution

id	name	price	category	isPopular	category_id
1	eraser	100	stationary	1	0.0
2	pencil	200	stationary	0	0.0
3	socks	500	clothes	1	1.0
4	pants	1000	clothes	0	1.0
5	apple	100	food	0	2.0

Passer à une expression unique

#colonne isPopular et category_Extraire uniquement l'identifiant (cela ne fonctionnera que s'il s'agit d'une valeur entière)
df_X = df.drop(['id','name','price','category'], axis=1)

from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
enc.fit(df_X)
onehot_array = enc.transform(df_X).toarray()
onehot_df = pd.DataFrame(onehot_array)
df = pd.concat([df_id, onehot_df], axis=1)
df

Résultat d'exécution

id	0	1	2	3	4
1	0.0	1.0	1.0	0.0	0.0
2	1.0	0.0	1.0	0.0	0.0
3	0.0	1.0	0.0	1.0	0.0
4	1.0	0.0	0.0	1.0	0.0
5	1.0	0.0	0.0	0.0	1.0

Recommended Posts

[Python] Mémo d'opération de pandas DataFrame

Fonctionnement de base de Python Pandas Series et Dataframe (1)

[Python] Opération d'énumération

Fonctionnement de base des pandas

Fonctionnement de base des Pandas

Mémo d'opération de décorateur Python

Application Python: Pandas # 3: Dataframe

Fonctionnement automatique de Chrome avec Python + Sélénium + pandas

Le pouvoir des pandas: Python

Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)

[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)

Mémo Pandas

Jeu à la main Python (Pandas / DataFrame début)

Mémo Python

mémo python

Mémo Python

"Python startbook" mémo compatible python3

mémo python

[Mémo] Petite histoire de pandas, stupide

Mémo Python

Graphiques Python séparés (mémo)

mémo pandas

Mémo de fonctionnement de l'environnement virtuel Conda

Mémo Python

[Python] Résumé de l'utilisation des pandas

[Mémo d'apprentissage] Bases de la classe par python

[Mémo du débutant Python] chaîne de caractères python, opération de chemin

Application de Python: Pandas Partie 4: Concaténation et combinaison de DataFrames

Structure et fonctionnement des données Python (mémo d'apprentissage Python ③)

[Pandas_flavor] Ajouter une méthode de Pandas DataFrame

Pandas du débutant, par le débutant, pour le débutant [Python]

[Python] Ajouter le nombre total de lignes à Pandas DataFrame

Note de problèmes sur la coexistence du système Python 2/3

[Python] Mémo sur le dictionnaire

Mes pandas (Python)

mémo débutant python (9.2-10)

[python] Opération vectorielle

mémo débutant python (9.1)

[Python] Visualisez la chaleur de Tokyo et de la préfecture ○○ (mémo d'utilisation de DataFrame)

Les bases de Python ①

★ Mémo ★ Python Iroha

Bases de python ①

Fonctionnement du système d'exploitation Python

Mémo de l'opération de position de pixel pour les données d'image avec Python (numpy, cv2)

Copie de python

[Python] Mémo EDA

Mémo opérateur Python 3

[Python] Opération de matrice

Mémorandum d'opération Pandas

[Mon mémo] python

Mémo de métaclasse Python3

[Python] Mémo de fond de carte

Mémo débutant Python (2)

mémo pandas python

[Python] Mémo Numpy

Introduction de Python

Un mémo qui a fait un tutoriel pour exécuter python sur heroku

Résumé de la correspondance entre les opérations de tableau ruby et python