python-2.7.4 windows7
test.py
#coding:utf-8
#Importer des pandas en tant que PD
import pandas as pd
#Chemin du fichier Excel à lire
input_path = "input.xlsx"
#Chemin du fichier Excel à écrire
output_path = "output.xlsx"
#Lire un fichier Excel en type de trame de données avec des pandas
data = pd.read_excel(data_path, sheetname = 'Sheet1')
#Sélectionnez uniquement les lignes spécifiées(Pour la correspondance de chaîne)
specified_line_data = data.where(data.Result.str.contains("Chaîne")).dropna(axis=0)
#Sélectionnez uniquement les lignes spécifiées(Cliquez ici pour la correspondance numérique)
#specified_line_data = data.where(data.Result ==Nombres).dropna(axis=0)
#Utilisez Excel Writer, un module de pandas, pour écrire dans Excel
writer = pd.ExcelWriter(output_path)
#Écrire dans un fichier Excel
specified_line_data.to_excel(writer, sheet_name = 'output_data')
#Sauvegardez les informations écrites
writer.save()
Cette fois, j'ai trouvé une méthode pour écrire uniquement la ligne spécifiée des données lues dans un autre fichier Excel. (Plus précisément, seuls ceux dont la chaîne de caractères de la colonne Résultat correspond ("chaîne de caractères") sont extraits)
(Notez que la première ligne est reconnue comme un en-tête lors de la lecture d'un fichier avec des pandas. Cette fois, les informations d'en-tête (Test, Label, Résultat, Score, Classe, Morphème) sont décrites dans la première ligne du fichier lu. Comme cela a été fait, le traitement des en-têtes n'est pas effectué par programme.)
Recommended Posts