Une bibliothèque pour gérer des données structurées (données de type table) en Python. Il s'agit d'une bibliothèque qui peut facilement effectuer la lecture de fichiers et le traitement / extraction ultérieur (cela peut être effectué comme SQL), et est indispensable pour le prétraitement des données tel que l'apprentissage automatique. Le tableau pour les autres éléments est ici.
Dans cet article, il s'agit de la méthode de traitement du nombre de chiffres. La première chose à comprendre est de savoir comment ajuster le nombre de chiffres dans les pandas lui-même et comment ajuster le nombre de chiffres dans les trames de données et les variables individuelles. Notez également que l'arrondissement des pandas n'est pas un arrondi, mais un arrondi à des nombres pairs. Si vous ne connaissez pas l'arrondi à égal, vérifiez-le.
Tout d'abord, importez la bibliothèque. Nommez pandas pd et importez-le.
python
import pandas as pd
J'essaierai l'exemple avec les données du Titanic. Si vous ne connaissez pas Titanic, veuillez cocher "kaggle Titanic".
python
dataframe = pd.read_csv('train.csv')
Divers paramètres des pandas sont gérés par ʻoption. (Il existe diverses autres options, veuillez donc vérifier si vous êtes intéressé.) Le nombre total de chiffres est géré par
display.float_format, et le nombre de chiffres après la virgule décimale est géré par
display.precision`.
Vérifions-le réellement.
In
print(pd.options.display.float_format)
print(pd.options.display.precision)
Out
None
6
Il n'y a pas de limite au nombre total de chiffres et 6 chiffres sont affichés après la virgule décimale. En regardant les données réelles, par exemple, le tarif est affiché jusqu'à 4 chiffres après la virgule décimale. Ceci est affiché comme ceci parce que les données CSV originales n'ont que 4 chiffres, mais si le nombre de chiffres est grand, il sera affiché jusqu'à 6 chiffres.
Modifiez ensuite cette valeur pour afficher deux chiffres après la virgule décimale. (L'affichage du tarif sera de 2 chiffres)
python
pd.options.display.precision = 2
Utilisez reset_option
si vous voulez initialiser.
python
pd.reset_option('display.precision')
Utilisez round ()
pour les réglages individuels. Si vous souhaitez utiliser 2 chiffres après la virgule décimale, ce sera comme suit. (L'affichage du tarif sera de 2 chiffres)
python
dataframe.round(2)
Si vous souhaitez le définir pour chaque colonne, ce sera comme suit. (Exemple: l'âge est de 1 chiffre et le tarif est de 3 chiffres.)
python
dataframe.round({'Age':1, 'Fare':3})
Comme un débutant peut le comprendre, nous avons résumé les connaissances nécessaires lors de la mise en œuvre de l'apprentissage automatique avec Python dans un simple article. La table des matières est ici, donc j'espère que vous pourrez également vous référer à d'autres articles.
Recommended Posts