Je voulais échapper au problème d'Unicode, j'ai donc choisi Python3, mais j'obtiens un UnicodeDecodeError car mecab-python3 ne fonctionne pas correctement.
De plus, lorsque vous exécutez le test, il sort au hasard
import MeCab
mecab = MeCab.Tagger()
node = mecab.parseToNode("Des cuisses et des cuisses")
while node:
print(node.surface)
node = node.next
Puis
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-11-1f88b1ec9c08> in <module>()
1 while node:
----> 2 print(node.surface)
3 node = node.next
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 0: invalid start byte
L'erreur est ...
C'est difficile à guérir, on dit donc de faire mecab.parse (" ")
en premier.
import MeCab
mecab = MeCab.Tagger()
mecab.parse("") #ajouter à
node = mecab.parseToNode("Des cuisses et des cuisses")
while node:
print(node.surface)
node = node.next
Puis
Sumomo
Aussi
Les pêches
Aussi
Les pêches
de
domicile
l'a fait. Je ne suis pas sûr, mais cela a commencé à fonctionner.
Recommended Posts