Résumé des processus souvent effectués par Pandas 1 (CSV, opérations liées aux fichiers Excel)

Il est presque temps d'utiliser Pandas pour les affaires, alors Je ne sais pas quel nombre brasser, mais j'aimerais résumer les processus fréquemment utilisés.

Lors de la lecture d'un fichier CSV

import pandas as pd

#Nom de fichier: échantillon.csv
#Le contenu du fichier est décrit ci-dessous
# 1,Échantillon de taro,30
# 2,Échantillon de Hanako,25
# 3,Échantillon Jiro,28
df = pd.read_csv('sample.csv', 
                 #Si aucun, il n'y a pas d'en-tête et si vous spécifiez un nombre, cette ligne est interprétée comme un en-tête.
                 header=None, 
                 #Précisez la colonne à indexer * Ici, la première colonne(1,2,Partie 3)
                 index_col=0, 
                 #Définissez le nom de la colonne
                 names=('name', 'age'),
                 #Définir le type de données de la colonne
                 dtype={'name': str, 'age': int}
                )

Lors de la lecture à partir d'un fichier Excel

import pandas as pd

#Nom de fichier: échantillon.xlsx
#* Le contenu du fichier est le même que celui du fichier CSV ci-dessus.
df = pd.read_excel('sample.xlsx', 
                   dtype={'name': str, 'age': int}
                  )

Lors de la lecture de plusieurs feuilles à partir d'un fichier Excel en même temps

import pandas as pd

excel_book = pd.ExcelFile('sample.xlsx')

#Vous pouvez obtenir une liste des noms de feuille des feuilles chargées dans une liste.
sheet_name_list = excel_book.sheet_names

#Si vous spécifiez un nom de feuille, vous pouvez obtenir le contenu de cette feuille.
df = excel_book.parse('sheet1')

Lors de la sortie du contenu d'une trame de données dans un fichier CSV

import pandas as pd

#Le premier argument est le nom du fichier de sortie
df.to_csv('sample.csv', 
          #Définissez False si aucun en-tête n'est nécessaire
          header=False, 
          #Définissez False si aucun index n'est nécessaire
          index=False, 
          #Défini lors de la limitation des colonnes de sortie
          columns=['name']
         )

Lors de la sortie du contenu d'un bloc de données dans un fichier Excel

import pandas as pd

#Le premier argument est le nom du fichier de sortie
df.to_excel('sample.xlsx', 
          #Définissez False si aucun en-tête n'est nécessaire
          header=False, 
          #Définissez False si aucun index n'est nécessaire
          index=False, 
          #Défini lors de la limitation des colonnes de sortie
          columns=['name']
         )

Recommended Posts

Résumé des processus souvent effectués par Pandas 1 (CSV, opérations liées aux fichiers Excel)
Résumé des méthodes fréquemment utilisées chez les pandas
Résumé des opérations souvent effectuées avec asyncpg
Résumé des opérations Excel utilisant OpenPyXL en Python
résumé lié à l'opération de fichier python
Résumé des différentes opérations dans Tensorflow
Résumé de la grammaire fréquemment utilisée dans les pandas
Résumé de ce qui a été utilisé dans 100 coups de Pandas (# 1 ~ # 32)
Notes personnelles des opérations liées aux pandas qui peuvent être utilisées dans la pratique
[Python] Résumé des opérations sur les fichiers S3 avec boto3
Évaluation de la vitesse de sortie du fichier CSV en Python
Opérations sur les fichiers en Python
Lire le fichier CSV: pandas
Résumé des opérations sur les chaînes
[Python] Création d'un outil GUI qui traite automatiquement le CSV des données d'élévation de température dans Excel
Résumé des processus souvent effectués par Pandas 2 (référence des données, opération d'édition)
[Python] Ouvrez le fichier csv dans le dossier spécifié par pandas
Résumé des opérations de liste Python3
Résumé de l'utilisation de base de Pandas
Comment coller un fichier CSV dans un fichier Excel à l'aide de Pandas
Points à noter lorsque les pandas lisent le csv de la sortie Excel
Mettre en forme le fichier CSV de "Fête nationale" du Cabinet Office avec des pandas