Pour extraire des données dans une colonne spécifique dans une feuille spécifique dans plusieurs fichiers Excel à la fois et mettre les données dans chaque colonne sur une ligne

Contexte

Lorsque vous souhaitez ** extraire par lots ** les données de ** colonnes spécifiques ** dans la ** feuille spécifique ** de plusieurs fichiers Excel et les mettre sur une seule ligne, vous pouvez les traiter rapidement à l'aide de python. J'ai donc décidé de l'organiser sous forme de mémorandum.

1. 1. Pour lire plusieurs fichiers Excel

import glob
files=glob.glob(r'/Pour l'analyse des résultats d'examen/*.xlsx')
import pandas as pd
for file in files:
    df = pd.read_excel(file, sheet_name='Liste des points à souligner')
    for row in df.values:
      #Extraire les données dans la 10e colonne
      s_data = str(row[9]).strip().rstrip()

2. Post-traitement

--Lorsque les données de date sont incluses ――Lorsque vous lisez un fichier Excel avec python, vous pouvez rencontrer un événement où la date affichée sur le fichier Excel est convertie en un nombre à 5 chiffres tel que 41496. Il semble que cela soit dû au fait que la date dans Excel commence le 1er janvier 1900 (le premier jour) et que les données de date sont conservées sous forme de valeur numérique obtenue en ajoutant le nombre de jours à partir de cela. (Voir l'article connexe 2). ――Par conséquent, il est nécessaire de créer la fonction suivante et de la convertir, je vais donc décrire le code qui a réellement fonctionné.

def excel_date(num):
    from datetime import datetime, timedelta
    return(datetime(1899, 12, 30) + timedelta(days=num))

print(pd.to_datetime(excel_date(row[11]), format='%Y année%m mois%jour j'))

C'est tout. (S'il existe un moyen plus simple, veuillez commenter)

Article associé

  1. Obtenez la liste des fichiers dans un dossier avec Python
  2. Convertir le "nombre" de date Excel en date-heure Python

Recommended Posts

Pour extraire des données dans une colonne spécifique dans une feuille spécifique dans plusieurs fichiers Excel à la fois et mettre les données dans chaque colonne sur une ligne
Obtenez de manière récursive la liste Excel dans un dossier spécifique avec python et écrivez-la dans Excel.
Entrer simultanément des données spécifiques sur une feuille spécifique dans de nombreux Excel
Comment insérer un processus spécifique au début et à la fin de l'araignée avec la tremblante
J'ai essayé de créer un script qui retrace les tweets d'un utilisateur spécifique sur Twitter et enregistre l'image publiée à la fois
Comment afficher une colonne de fichiers spécifiée sous Linux (awk)
Comment copier et coller le contenu d'une feuille au format JSON avec une feuille de calcul Google (en utilisant Google Colab)
Comment obtenir un nom de colonne et un nom d'index spécifiques avec Pandas DataFrame
Comment mettre un numéro de ligne au début d'un fichier CSV
Convertir plusieurs CSV en chaque feuille Excel
Je voulais connaître le nombre de lignes dans plusieurs fichiers et j'ai essayé de l'obtenir avec une commande
One-liner qui crée un grand nombre de fichiers de test à la fois sous Linux
Comment compter le nombre d'éléments dans Django et sortir dans le modèle
Dans pandas.DataFrame, même lors de l'attribution d'une seule colonne spécifique, si l'index est attaché, vous n'avez pas à vous soucier de l'ordre des données
Je souhaite voir une liste de fichiers WebDAV dans le module Requêtes
La première étape de l'analyse du journal (comment formater et mettre les données du journal dans Pandas)
Comment obtenir une liste de fichiers dans le même répertoire avec python
[Python] Je souhaite rassembler des fichiers spécifiques dispersés dans chaque dossier au même endroit
J'ai créé un outil en Python qui clique avec le bouton droit sur un fichier Excel et le divise en fichiers pour chaque feuille.
Comment lister les fichiers dans le répertoire spécifié (plusieurs conditions / recherche de sous-répertoire)
[Python] Changer la couleur du texte et la couleur d'arrière-plan d'un mot clé spécifique dans la sortie d'impression
Comment vérifier en Python si l'un des éléments d'une liste est dans une autre liste
Sortie de la table spécifiée de la base de données Oracle en Python vers Excel pour chaque fichier
Je voulais juste extraire les données de la date et de l'heure souhaitées avec Django
Une solution au problème que les fichiers contenant [et] ne sont pas répertoriés dans glob.glob ()
[Note de compression d'information 003] Un plan pour compresser les conférences et les écritures du tableau d'un professeur d'électromagnétique dans une université terne en un Jpeg.
Attribuer à n'importe quelle colonne de chaque ligne avec np.array
Je suis à Singapour en ce moment Une histoire sur la création d'un LineBot et la volonté de faire un travail mémorable
J'ai créé un outil pour obtenir les liens de réponse d'OpenAI Gym en même temps
Obtenir la valeur d'une clé spécifique jusqu'à l'index spécifié de la liste de dictionnaires en Python
Procédure pour changer le nom de la table et le nom de la colonne du modèle Django en même temps
Extraire uniquement le son d'un instrument spécifique du fichier MIDI et en faire un fichier séparé
Comment représenter la distribution de la composition bactérienne à partir des données d'analyse Qiime2 dans un diagramme de moustaches
Comment envoyer des fichiers d'un seul coup en se connectant à un hôte de l'autre côté de la plate-forme avec SCP en plusieurs étapes
Jetons un coup d'œil à la tendance infectieuse du nouveau coronavirus COVID-19 dans chaque pays et à l'état de la réponse médicale (informations supplémentaires).