[Python] Lire le csv japonais avec des pandas sans caractères déformés (extraire davantage les colonnes écrites en japonais)

J'étudie pour Python 2.7.6 avec pycharm.

Cette fois, j'ai lu le fichier csv écrit en japonais pour être analysé Un fichier merveilleusement déformé a été produit. À la suite de diverses enquêtes, il a été résolu par la méthode suivante.

Pourquoi le fichier csv est brouillé

Les fichiers déformés peuvent être créés de la même manière que l '[Entrée] précédemment créée (http://qiita.com/redAlgae/items/1d9788b6f0b6613bf711). Je l'ai fait.

import pandas as pd
import os

#Spécifiez le chemin d'accès au répertoire de travail dans lequel les données sont stockées
os.chdir("/Chemin du fichier vers le répertoire")
#Lire csv
df= pd.read_csv("japanese.csv")
print df

Cependant, lors de la lecture de csv, le code de caractère n'a pas été spécifié, donc Le fichier déformé a été lu avec succès.

Comment lire un fichier csv japonais sans caractères déformés

Ainsi, lorsque je lis le fichier csv avec SHIFT-JIS par la méthode suivante, Le fichier csv était affiché en japonais!

import pandas as pd
import os

#Spécifiez le chemin d'accès au répertoire de travail dans lequel les données sont stockées
os.chdir("/Chemin du fichier vers le répertoire")
#Lecture de csv avec le code de caractère spécifié
df= pd.read_csv("japanese.csv",encoding="SHIFT-JIS")
print df

Maintenant que le fichier csv japonais a été lu de cette manière, il est temps de traiter les données! Cependant, en jouant avec le code de caractère, j'ai changé la colonne spécifiée en japonais. Je n'ai pas pu l'obtenir et j'ai de nouveau lutté ...

Extraire uniquement les colonnes écrites en japonais

Spécifiez explicitement la colonne pour récupérer uniquement les colonnes souhaitées loc [:, "nom de colonne souhaité"] Si vous écrivez, il obtiendra toutes les colonnes sous "nom de colonne souhaité". Ici a une explication détaillée. En conséquence, si vous écrivez comme suit, La colonne où "le nom de la colonne souhaitée" est écrit J'ai pu l'obtenir doucement!

import pandas as pd
import os

#Spécifiez le chemin d'accès au répertoire de travail dans lequel les données sont stockées
os.chdir("/Chemin du fichier vers le répertoire")
#Lecture de csv avec le code de caractère spécifié
df= pd.read_csv("japanese.csv,encoding="SHIFT-JIS"")
column = df.loc[:,[u'Nom de la colonne souhaitée']]
print column 

Je suis également tombé sur les bases cette fois-ci, Si quelqu'un a le même problème, ce serait utile ...

Recommended Posts

[Python] Lire le csv japonais avec des pandas sans caractères déformés (extraire davantage les colonnes écrites en japonais)
Lire csv avec des pandas python
Élimination des caractères japonais brouillés de matplotlib et NetworkX de la bibliothèque Python
Extraire le texte du pdf [python] et lire les caractères à haute voix avec Open-Jtalk
Chargez csv avec des colonnes en double dans pandas
Lisez CSV et analysez avec Pandas et Seaborn
Lire et formater des fichiers csv mélangés avec des tabulations de virgule avec des pandas Python
Lire les données csv Python avec Pandas ⇒ Graphique avec Matplotlib
Lire JSON avec Python et générer un CSV
Créer une image avec des caractères avec python (japonais)
[Python] Lisez le fichier csv et affichez la figure avec matplotlib
Extraire le jeu de données bigquery et la liste des tables avec python et la sortie en CSV
[Python3] Enregistrez la matrice de moyenne et de covariance dans json avec les pandas
Extraire plusieurs colonnes spécifiques avec des pandas
Lire des fichiers en parallèle avec Python
Lire et écrire du CSV avec Python
Ignorer # ligne et lire avec les pandas
Extraire des tables de base de données avec CSV [connexion ODBC de R et python]
Créer et lire des paquets de messages en Python
Remplissez la chaîne avec des zéros en python et comptez certains caractères de la chaîne
Lisez le fichier CSV avec Python et convertissez-le en DataFrame tel quel
Joindre les données avec la clé principale (obligatoire) et la sous-clé (facultative) dans les pandas Python
Test de stress avec Locust écrit en Python
[Note] Les caractères japonais sont déformés avec atom-runner
Lire le fichier CSV avec python (Télécharger et analyser le fichier CSV)
Lire et écrire des fichiers csv avec numpy
Gérer les "années et mois" en Python
Lire Python csv et exporter vers txt
Lire et écrire des fichiers JSON avec Python
Windows Qt5.4 Python3.4 QProcess caractères japonais brouillés
Comment lire des fichiers CSV avec Pandas
Chargez CSV avec des pandas et jouez avec Index
Ajouter une série à la colonne dans les pandas python
Lire des caractères dans des images avec Python OCR
[Introduction à Pandas] Lire un fichier csv sans nom de colonne et lui donner un nom de colonne
Cours de base sur Python Traitement CSV (fonctions et classes n ° 1 CSV est lu et écrit)
Comment lire un fichier CSV avec Python 2/3
Grattage de la nourriture avec python et sortie en CSV
Prétraitement de texte japonais sans instruction for dans les pandas
Lire un fichier contenant des lignes brouillées en Python
[Automation] Extraire le tableau en PDF avec Python
[Python] Comment lire des fichiers Excel avec des pandas
Lire les données de la table dans un fichier PDF avec Python
Lire et écrire des fichiers CSV et JSON avec Python
Gérer les fichiers zip avec des noms de fichiers japonais dans Python 3
[Python3] Lecture et écriture avec isoformat datetime avec json
Extraire le zip avec Python (prend en charge les noms de fichiers japonais)
Extraire les pièces jointes reçues par Thunderbird avec Python
Correction des caractères déformés lors du traitement du japonais dans les requêtes
[Python] Comment gérer les caractères japonais avec openCV
Ajouter des totaux aux lignes et aux colonnes avec des pandas
Exemple de lecture et d'écriture de CSV avec Python
Comparez la vitesse de lecture / écriture et la capacité de csv, pickle, joblib, parquet dans un environnement python
Consolider un grand nombre de fichiers CSV dans des dossiers avec python (données sans en-tête)
CSV en Python
Traitement pleine largeur et demi-largeur des données CSV en Python
Pour pouvoir utiliser le japonais avec Python dans l'environnement Docker
Lisez et analysez l'ensemble de données au format arff avec python scipy.io
Lisez le fichier csv et affichez-le dans le navigateur
Lire la liste de liens au format csv avec l'outil graphique