Voici deux façons de convertir le code de caractère d'un fichier avec Python3.
Cette fois, j'ai un fichier CSV avec le code de caractère "shift-jis", et j'écrirai le code pour le convertir en "utf-8".
Vous pouvez lire et écrire des fichiers en spécifiant le code de caractère à l'aide de codecs.
utf8_test1.py
# -*- coding:utf-8 -*-
import codecs
def main():
# Shift_Chemin du fichier JIS
shiftjis_csv_path = './download/shift_jis_data.csv'
# UTF-8 Chemin du fichier
utf8_csv_path = './download/utf8_data.csv'
#Code de caractère utf-Convertissez en 8 et économisez
fin = codecs.open(shiftjis_csv_path, "r", "shift_jis")
fout_utf = codecs.open(utf8_csv_path, "w", "utf-8")
for row in fin:
fout_utf.write(row)
fin.close()
fout_utf.close()
if __name__ == '__main__':
main()
Vous pouvez convertir le code de caractère en appelant la commande nkf depuis Python.
utf8_test2.py
# -*- coding:utf-8 -*-
import subprocess
def main():
# Shift_Chemin du fichier JIS
shiftjis_csv_path = './download/shift_jis_data.csv'
# UTF-8 Chemin du fichier
utf8_csv_path = './download/utf8_data.csv'
cmd = "nkf -w %s > %s" % (shiftjis_csv_path, utf8_csv_path)
subprocess.call(cmd, shell=True)
if __name__ == '__main__':
main()
Cependant, nkf n'est pas une fonctionnalité Python, vous devez donc avoir nkf installé à l'avance.
$ brew install nkf
Recommended Posts