Jugement de codage en Python
Lisez la chaîne d'octets et déduisez l'encodage utilisé à partir de ce modèle.
UniversalDetector
et chargez-le petit à petit avec la méthode `` `feed```.import chardet
from urllib.request import urlopen
with urlopen('http://qiita.com/') as response:
html = response.read()
print(chardet.detect(html)) // {'confidence': 0.99, 'encoding': 'utf-8'}
C'est facile à faire,
Recommended Posts
Interfaces principales du détecteur universel code>: p>
detector.feed```: Une méthode pour lire une chaîne d'octets
Detector.done: Une propriété pour le jugement final qui devient `` True
lorsque la fiabilité dépasse un certain seuil.
detector.result```: Propriété où le résultat est stocké
detector.reset```: Méthode pour initialiser l'objetfrom chardet.universaldetector import UniversalDetector
from urllib.request import urlopen
detector = UniversalDetector()
with urlopen('http://qiita.com/') as response:
for l in response:
detector.feed(l)
if detector.done:
break
detector.close()
print(detector.result) // {'confidence': 0.99, 'encoding': 'utf-8'}
Detector.feed '' pour lire
Detector '' ligne par ligne, et `` Detecor.done '' pour vérifier si le jugement est complet. Ensuite, le flux d'affichage du résultat à la fin.Pour approfondir