Lorsque j'essaie d'obtenir la chaîne de caractères du PDF, des caractères étranges sont parfois inclus. Même si j'essaie de trouver un endroit correspondant en recherchant, cela ne fonctionne pas.
Haute altitude Mida Mt.
N'est-ce pas différent? Il avait exactement la même apparence sur la console, il m'a donc fallu un certain temps pour comprendre pourquoi je ne pouvais pas le trouver.
J'ai oublié comment j'ai cherché et comment je suis arrivé, mais je l'ai mentionné ici. https://qiita.com/korkewriya/items/e747253b715f41febfc4
#On suppose que le résultat contient déjà une chaîne de caractères
from unicodedata import normalize
result = normalize('NFKC', result) #Normalisation Unicode
Recommended Posts