Résumé de ce qui a été utilisé dans 100 coups de Pandas (# 1 ~ # 32)

introduction

J'étudie ** l'apprentissage automatique ** à l'université. J'ai également essayé ** Pandas 100 coups ** pour examen. La fonction utilisée? Je voudrais résumer.

Pandas 100 coups

Cliquez ici pour plus de détails Pandas 100 coups pour les débutants en Python

Notions de base sur les pandas (1 ~ 13)

# 1 Afficher les 5 premières lignes de DataFrame

df.head()

Lors de la spécification du nombre de lignes que vous souhaitez afficher

Exemple: 10 lignes

df.head(10)

# 2 Afficher les 5 dernières lignes

df.tail()

# 5 df'fare'est trié et affiché par ordre croissant

df.sort_values('fare')

Trier par ordre décroissant en spécifiant ** croissant = False **

Extraction de données (14 ~ 32)

# 18 Utilisez loc pour afficher le df entier

df.loc[:,:]

Utilisez # 20 loc pour afficher jusqu'à la 10e ligne de la colonne tarifaire df

df.loc[:10, 'fare']

Extraire uniquement les données dont la valeur de colonne d'âge de # 25 df est de 30 ou plus

df[df['age'] >= 30]

Seules les données avec la colonne sexe # 27 df femme et 40 ans ou plus sont extraites

df[(df['sex'] == "female") & (df['age'] >= 40)]

Utilisez la requête n ° 28 pour extraire uniquement les données dont la colonne de sexe df est une femme et l'âge de 40 ans ou plus

df.query('sex == "female" & age >= 40')

Afficher les données contenant la chaîne de caractères "Mme" dans la colonne de nom de # 29 df

df.query('name.str.contains("Mrs")', engine='Python')

# 30 Afficher uniquement les colonnes de caractères dans df

df.select_dtypes(include='object')

# 31 Vérifiez le nombre d'éléments dans chaque colonne de df

df.nunique()

Vérifiez les éléments de la colonne embarquée de # 32 df et le nombre d'occurrences

df['embarked'].value_counts()

Impression que j'ai essayé à mi-chemin

J'avais l'impression de m'habituer tellement aux Pandas, mais quand je l'ai essayé, ma confiance en moi était brisée ... Ce sera une bonne critique, alors essayez-la même si vous y êtes habitué. requête Très pratique ...

Recommended Posts

Résumé de ce qui a été utilisé dans 100 coups de Pandas (# 1 ~ # 32)
Résumé des méthodes fréquemment utilisées chez les pandas
Résumé de la grammaire fréquemment utilisée dans les pandas
Résumé des outils utilisés dans la ligne de commande vol.8
Résumé des outils utilisés dans la ligne de commande vol.5
Résumé des fonctions d'évaluation utilisées dans l'apprentissage automatique
Récapitulatif des méthodes Pandas utilisées lors de l'extraction de données [Python]
2017.3.6 ~ 3.12 Résumé de ce que nous avons fait
Résumé de l'utilisation de base de Pandas
Résumé de l'écriture des fichiers .proto utilisés dans gRPC
Caractéristiques de pd.NA dans Pandas 1.0.0 (RC0)
H29.2.27 ~ 3.5 Résumé de ce que j'ai fait
Résumé des différentes opérations dans Tensorflow
[Anaconda3] Résumé des commandes fréquemment utilisées
Résumé des commandes fréquemment utilisées de django (débutant)
[Linux] Liste des commandes Linux utilisées dans la pratique
Résumé de diverses instructions for en Python
Résumé des processus souvent effectués par Pandas 1 (CSV, opérations liées aux fichiers Excel)
Résumé des pierres d'achoppement lors de l'installation de CaboCha
Résumé des modules et des classes dans Python-TensorFlow2-
Résumé des méthodes intégrées, etc. de la liste Python
Traitement des mémos souvent utilisés dans les pandas (débutants)
Collection de conseils Numpy, Pandas souvent utilisés sur le terrain
Notes personnelles des opérations liées aux pandas qui peuvent être utilisées dans la pratique
Résumé des outils et bibliothèques OSS créés en 2016
Résumé de la façon d'importer des fichiers dans Python 3
Utilisation des fonctions récursives utilisées chez les pros de la compétition
Divulgation complète des méthodes utilisées dans l'apprentissage automatique
Résumé de l'utilisation de MNIST avec Python
L'en-tête est mal aligné avec read_csv () et read_table () de Pandas
Correction des arguments de la fonction utilisée dans map
Résumé des tableaux Python fréquemment utilisés (pour moi-même)
Résumé des commandes fréquemment utilisées (avec petit commentaire)
Selenium Webdriver Résumé des méthodes de fonctionnement fréquemment utilisées
Résumé des opérations Excel utilisant OpenPyXL en Python
Résumé des méthodes d'analyse de données statistiques utilisant Python qui peuvent être utilisées en entreprise
[Traitement du langage 100 coups 2020] Résumé des exemples de réponses par Python
Utilisé depuis l'introduction de Node.js dans l'environnement WSL
Résumé des outils nécessaires pour analyser les données en Python
Un résumé divers de ce que j'ai recherché sur Ansible
Résumé des commandes Linux (UNIX) fournies avec Progate
Une collection de code souvent utilisée dans Python personnel
Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)
Une collection de commandes fréquemment utilisées dans la gestion des serveurs
Liste du code Python utilisé dans l'analyse de Big Data
pickle Pour lire ce qui a été fait en 2 séries avec 3 séries
[Python] Résumé de la méthode de création de table utilisant DataFrame (pandas)
Un résumé des choses que j'ai touchées comme un blog
Résumé des choses qui étaient pratiques lors de l'utilisation de pandas
Qu'est-ce qu'un moteur de recommandation? Résumé des types
Récapitulatif du traitement de la date en Python (datetime et dateutil)
"Erreur de type: type de valeur non reconnu: <class'str '>" dans to_datetime des pandas