L'incident s'est produit lorsque j'ai simplement effectué l'écriture CSV → la lecture avec des pandas de Python comme suit.
import pandas as pd
#Définir des données variables et écrire dans un fichier CSV
data = pd.DataFrame({'name': ['Taro', 'Hanako', 'Jiro', 'Yuki'],
'Math': [80, 15, 90, 50],
'Anglais': [80, 70, 50, 65],
'langue nationale': [ 90, 60, 60, 60]})
print(data)
data.to_csv('a.csv')
#Lire et sortir le fichier CSV exporté
data = pd.read_csv('a.csv')
print(data)
Lorsque ce qui précède a été exécuté, il y avait une différence dans la sortie de chacun.
#Premier résultat de sortie
nom Mathématiques anglais japonais
0 Taro 80 80 90
1 Hanako 15 70 60
2 Jiro 90 50 60
3 Yuki 50 65 60
#Deuxième résultat de sortie
Unnamed:0 prénom Mathématiques Anglais Japonais
0 0 Taro 80 80 90
1 1 Hanako 15 70 60
2 2 Jiro 90 50 60
3 3 Yuki 50 65 60
Une colonne mystérieuse appelée «Sans nom: 0» a été ajoutée. Éliminez cela.
Dans l'écriture ci-dessus, le fichier CSV suivant a été généré.
,name,Math,Anglais,langue nationale
0,Taro,80,80,90
1,Hanako,15,70,60
2,Jiro,90,50,60
3,Yuki,50,65,60
Un inattendu ,
a été ajouté à gauche du nom sur la première ligne.
En conséquence, il semble que la première colonne soit considérée comme au porteur.
L'un ou l'autre des éléments suivants peut être utilisé. Vous n'êtes pas obligé de faire les deux.
Il peut être résolu en spécifiant index comme faux comme indiqué ci-dessous.
data.to_csv('a.csv', index=False)
À partir de ce qui précède, le fichier CSV suivant peut être généré.
name,Math,Anglais,langue nationale
0,Taro,80,80,90
1,Hanako,15,70,60
2,Jiro,90,50,60
3,Yuki,50,65,60
read_csv
Spécifiez la colonne d'index comme suit.
data = pd.read_csv('a.csv', index_col=0)
Recommended Posts