Je ne sais pas si c'est réellement le plus fort, mais la façon dont je pense que c'est ça
Cela fonctionne en copiant dans la cellule de code de Google Colab (probablement). Cela prendra du temps pour faire
, alors buvons du café et attendons ☕️
google_colab.ipynb
%%bash
#mecab et mecab-Installer les dépendances python3
apt-get install mecab swig libmecab-dev mecab-ipadic-utf8
# mecab-installation de python
pip install mecab-python3
#téléchargement crfpp(dépendances cabocha)
curl -sL -o CRF++-0.58.tar.gz "https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7QVR6VXJ5dWExSTQ"
tar -zxf CRF++-0.58.tar.gz
#installation de crfpp
cd CRF++-0.58
./configure && make && make install && ldconfig
cd ..
#téléchargement de cabocha
url="https://drive.google.com/uc?export=download&id=0B4y35FiV1wh7SDd1Q1dUQkZQaUU"
curl -sc /tmp/cookie ${url} >/dev/null
code="$(awk '/_warning_/ {print $NF}' /tmp/cookie)"
curl -sLb /tmp/cookie ${url}"&confirm=${code}" -o cabocha-0.69.tar.bz2
tar -jxf cabocha-0.69.tar.bz2
#installation de cabocha
cd cabocha-0.69
./configure -with-charset=utf-8 && make && make check && make install && ldconfig
# cabocha-installation de python
pip install python/
cd ..
%%bash
mecab -v
pip show mecab-python3 | grep -e Name -e Version && echo
cabocha -v && echo
pip show cabocha-python | grep -e Name -e Version
output
mecab of 0.996
Name: mecab-python3
Version: 0.996.5
cabocha of 0.69
Name: cabocha-python
Version: 0.69
import MeCab
tagger = MeCab.Tagger()
print(tagger.parse("Le client d'à côté est un client qui mange souvent des kakis"))
output
Nomenclature voisine,Général,*,*,*,*,à côté de,Tonari,Tonari
Mots auxiliaires,syndicat,*,*,*,*,de,Non,Non
Nomenclature client,Général,*,*,*,*,Client,Cocu,Cocu
Est un assistant,Assistance,*,*,*,*,Est,C,sensationnel
Bien complémentaire,Général,*,*,*,*,Souvent,Yoku,Yoku
Kaki substantif,Général,*,*,*,*,kaki,huître,huître
Manger verbe,Indépendance,*,*,Rappel de ligne Godan / Wa,Forme basique,Manger,Ku,Ku
Nomenclature client,Général,*,*,*,*,Client,Cocu,Cocu
Verbe auxiliaire,*,*,*,Spécial,Forme basique,Est,Da,Da
EOS
import CaboCha
cp = CaboCha.Parser()
print(cp.parseToString("Le client d'à côté est un client qui mange souvent des kakis"))
output
à côté de-D
Les clients-------D
Souvent---D |
kaki-D |
Manger-D
C'est un client
EOS
Recommended Posts