Rendre le moteur d'analyse morphologique "MeCab" disponible à partir de Python3 installé dans pyenv sur Mac.
Fondamentalement, le contenu de l'article de résumé existant est le même, mais le référentiel officiel de GitHub a été corrigé, et le travail de correction manuelle dans l'article original consiste simplement à modifier le code de liaison de ~~ Python C'était en bon état. ~~ (2016 / 3/2 revision) Tous ne sont plus nécessaires.
Je viens de compiler les informations de l'article original, mais j'ai réessayé l'installation plusieurs fois, je vais donc laisser les étapes derrière.
Site officiel http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html Référentiel https://github.com/taku910/mecab
Article original
git clone https://github.com/taku910/mecab.git
cd mecab/mecab
./configure --enable-utf8-only
make
make check
sudo make install
Après l'installation, mecab sera placé.
/usr/local/etc/mecabrc
/usr/local/bin/mecab
/usr/local/bin/mecab-config
~~ Démarrez mecab depuis la console, puis entrez le japonais pour afficher les résultats de l'analyse morphologique. ~~ _2016 / 3/2 postscript Dans la première édition, j'ai écrit l'explication en utilisant la commande mecab ici, mais je ne pouvais pas l'utiliser avant d'avoir installé le dictionnaire. _
~~ Téléchargez "Dictionnaire IPA" sur le site officiel. ~~ ~~http://taku910.github.io/mecab/#install~~ ~~http://taku910.github.io/mecab/#download~~
tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8
make
sudo make install
_2016/3/2 Addendum 2 Veuillez également sauter ici.
Il a été inclus dans le projet git sans le télécharger.
cd ../mecab-ipadic
./configure --with-charset=utf8
make
sudo make install
_2016/3/2 Addendum 2 Ceci est le dernier
À ce stade, démarrez mecab à partir de la console, puis entrez le japonais pour afficher les résultats de l'analyse morphologique.
$ mecab
MeCab est un logiciel gratuit
MeCab substantif,Nomenclature propriétaire,Organisation,*,*,*,*
Est un assistant,Assistance,*,*,*,*,Est,C,sensationnel
Nomenclature libre,Général,*,*,*,*,gratuit,gratuit,gratuit
Nomenclature des logiciels,Général,*,*,*,*,Logiciel,Logiciel,Logiciel
Est un verbe auxiliaire,*,*,*,Mort spéciale,Forme basique,est,mort,mort
EOS
_2016 / 3/2 postscript Il y avait une méthode plus simple que la première édition. Veuillez l'ignorer pendant un moment. _
~~ Ensuite, préparez-vous à utiliser MeCab de Python. Comme les liaisons de divers langages sont préparées dans le répertoire qui a été cloné par git précédemment, déplacez-vous vers le répertoire python. ~~
cd [Répertoire cloné MeCab git]
cd mecab/mecab/python
#2016/3/2 Addendum Veuillez sauter ici
~~ Maintenant, nous devons modifier le code dans setup.py d'une ligne. Veillez à ne pas effacer l'onglet avant le retour. ~~
~~ Cet article "MeCab avec Python 3" ~~
vi setup.py
def cmd2(str):
return string.split (cmd1(str))
Changé en
def cmd2(str):
return cmd1(str).split()
#2016/3/2 Addendum Veuillez également sauter ici
~~ Une fois la correction terminée, installez-le. ~~
python setup.py build
sudo python setup.py install
#2016/3/2 Addendum Veuillez également sauter ici
_ PostScript 2016/3/2 _ _ Il y avait une procédure plus simple. Comme décrit dans l'article ci-dessous, vous pouvez l'utiliser à partir de Python 3 avec la commande pip. _
pip install mecab-python3
Essayez d'exécuter l 'exemple Python sur le site officiel. L'original est le code pour Python2, donc seule l'impression est modifiée.
import sys
import MeCab
m = MeCab.Tagger ("-Ochasen")
print(m.parse ("Je dois le faire aujourd'hui"))
Résultat d'exécution
Aujourd'hui Kyo Aujourd'hui Noun-Avocat possible
Les deux mo et mo-Assistance
Verbe shishi-Indépendance Sahen / Suru
Non Nai Non Verbe auxiliaire Special / Nai Forme de base
Et à et mots auxiliaires-Assistant de connexion
Assistante Nene ne-Aide finale
EOS
Veuillez me faire savoir si la procédure est incorrecte.
Recommended Posts