J'étudie pour Python 2.7.6 avec pycharm.
Cette fois, j'ai lu le fichier csv écrit en japonais pour être analysé Un fichier merveilleusement déformé a été produit. À la suite de diverses enquêtes, il a été résolu par la méthode suivante.
Les fichiers déformés peuvent être créés de la même manière que l '[Entrée] précédemment créée (http://qiita.com/redAlgae/items/1d9788b6f0b6613bf711). Je l'ai fait.
import pandas as pd
import os
#Spécifiez le chemin d'accès au répertoire de travail dans lequel les données sont stockées
os.chdir("/Chemin du fichier vers le répertoire")
#Lire csv
df= pd.read_csv("japanese.csv")
print df
Cependant, lors de la lecture de csv, le code de caractère n'a pas été spécifié, donc Le fichier déformé a été lu avec succès.
Ainsi, lorsque je lis le fichier csv avec SHIFT-JIS par la méthode suivante, Le fichier csv était affiché en japonais!
import pandas as pd
import os
#Spécifiez le chemin d'accès au répertoire de travail dans lequel les données sont stockées
os.chdir("/Chemin du fichier vers le répertoire")
#Lecture de csv avec le code de caractère spécifié
df= pd.read_csv("japanese.csv",encoding="SHIFT-JIS")
print df
Maintenant que le fichier csv japonais a été lu de cette manière, il est temps de traiter les données! Cependant, en jouant avec le code de caractère, j'ai changé la colonne spécifiée en japonais. Je n'ai pas pu l'obtenir et j'ai de nouveau lutté ...
Spécifiez explicitement la colonne pour récupérer uniquement les colonnes souhaitées loc [:, "nom de colonne souhaité"] Si vous écrivez, il obtiendra toutes les colonnes sous "nom de colonne souhaité". Ici a une explication détaillée. En conséquence, si vous écrivez comme suit, La colonne où "le nom de la colonne souhaitée" est écrit J'ai pu l'obtenir doucement!
import pandas as pd
import os
#Spécifiez le chemin d'accès au répertoire de travail dans lequel les données sont stockées
os.chdir("/Chemin du fichier vers le répertoire")
#Lecture de csv avec le code de caractère spécifié
df= pd.read_csv("japanese.csv,encoding="SHIFT-JIS"")
column = df.loc[:,[u'Nom de la colonne souhaitée']]
print column
Je suis également tombé sur les bases cette fois-ci, Si quelqu'un a le même problème, ce serait utile ...
Recommended Posts