Défiez le text mining avec Python. (Pour la série Python3) Suivez les étapes ci-dessous.
① Analyse morphologique (cet article) ② Visualisez avec Word Cloud (la prochaine fois)
La dernière fois, j'ai essayé d'utiliser MeCab sous Windows et je suis tombé sur l'installation de liaisons Python et j'ai abandonné, alors je suis passé à Linux et j'ai redémarré.
(la revue) Pour rendre MeCab disponible en Python ・ Installation de l'unité principale MeCab ・ Installation du dictionnaire · Installation de liaison Python Est nécessaire.
La version Windows est livrée avec un dictionnaire attaché à MeCab lui-même, mais la version Linux doit être installée séparément. Cependant, vous pouvez l'installer avec le package.
Installez simplement avec apt. Pour le dictionnaire, sélectionnez la version UTF-8 d'IPA (recommandé).
sudo apt-get install mecab mecab-ipadic-utf8
Comme d'habitude, vérifiez le fonctionnement avec "Momo no Uchi".
$ mecab
Des cuisses et des cuisses
Sumomo substantif,Général,*,*,*,*,Sumomo,Sumomo,Sumomo
Aussi assistant,Assistance,*,*,*,*,Aussi,Mo,Mo
Cuisse substantif,Général,*,*,*,*,Les pêches,pêche,pêche
Aussi assistant,Assistance,*,*,*,*,Aussi,Mo,Mo
Cuisse substantif,Général,*,*,*,*,Les pêches,pêche,pêche
Mots auxiliaires,syndicat,*,*,*,*,de,Non,Non
Dont nomenclature,Non indépendant,Avocat possible,*,*,*,domicile,Uchi,Uchi
EOS
Installez-le simplement avec apt.
sudo apt-get install python-mecab
Analysons "Sumomo ..." de Python.
mecab_sample.py
# coding: utf-8
import sys
import MeCab
mecab = MeCab.Tagger("-Ochasen")
print(mecab.parse("Des cuisses et des cuisses"))
$ python3 mecab_sample.py
Traceback (most recent call last):
File "mecab_sample.py", line 3, in <module>
import MeCab
ImportError: No module named 'MeCab'
On dit qu'il n'y a pas de MeCab ... Essayez de l'exécuter avec python 2.x.
$ python mecab_sample.py
Sumomo Sumomo substantif-Général
Les deux mo et mo-Assistance
Nomenclature de la pêche de la cuisse-Général
Les deux mo et mo-Assistance
Nomenclature de la pêche de la cuisse-Général
L'assistant de Nono-syndicat
Uchi Uchi Noun-Non indépendant-Avocat possible
EOS
Celui-ci fonctionne très bien. Lorsque j'ai cherché sur Google, il semble que ce que j'ai mis avec apt ne fonctionne qu'avec la série Python 2.x. Pour l'utiliser dans la série Python3, il semble nécessaire d'apporter le source et de le construire avec setup.py comme je l'ai fait dans la version Windows, mais il est également basé sur la série Python2 et un correctif est nécessaire pour l'exécuter dans la série Python3 Il semble que vous deviez le frapper, il semble donc que ce ne soit pas simple.
Euh, c'est un problème ... J'ai trouvé un article qui dit que c'est OK pour mettre une bibliothèque pour Python3 avec pip, donc je vais l'essayer.
$ pip3 install mecab-python3
Collecting mecab-python3
Using cached mecab-python3-0.7.tar.gz
Complete output from command python setup.py egg_info:
/bin/sh: 1: mecab-config: not found
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/tmp/pip-build-gsw8fi5f/mecab-python3/setup.py", line 41, in <module>
include_dirs=cmd2("mecab-config --inc-dir"),
File "/tmp/pip-build-gsw8fi5f/mecab-python3/setup.py", line 21, in cmd2
return cmd1(strings).split()
File "/tmp/pip-build-gsw8fi5f/mecab-python3/setup.py", line 18, in cmd1
return os.popen(strings).readlines()[0][:-1]
IndexError: list index out of range
----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-gsw8fi5f/mecab-python3/
J'obtiens une erreur car il n'y a pas de mecab-config comme dans Windows. Je n'ai pas spécifié libmecab-dev parce que je n'en avais pas besoin lorsque j'ai installé MeCab pour la première fois, il semble donc qu'il ne soit pas inclus. Entrez avec apt.
sudo apt-get install libmecab-dev
Ensuite, utilisez pip pour insérer la liaison pour la série Python3.
sudo pip3 install mecab-python3
Ensuite, exécutez l'exemple en Python3.
$ python3 mecab_sample.py
Sumomo Sumomo substantif-Général
Les deux mo et mo-Assistance
Nomenclature de la pêche de la cuisse-Général
Les deux mo et mo-Assistance
Nomenclature de la pêche de la cuisse-Général
L'assistant de Nono-syndicat
Uchi Uchi Noun-Non indépendant-Avocat possible
EOS
J'ai finalement pu le faire.
Recommended Posts