Analyseur de dépendances japonais. Utilisé pour le traitement du langage naturel.
Comme vous pouvez le voir sur le Site officiel, vous devez en gros télécharger la source et la saisir avec la commande suivante. Vous devez également installer CRF ++ et Mecab à l'avance.
./configure
make
make check
sudo make install
Si vous souhaitez l'utiliser avec python, vous pouvez également effectuer les opérations suivantes dans le dossier python.
python setup.py install
Le lien de téléchargement officiel accède au dossier public de Google Drive, donc je ne savais pas un instant quoi faire de l'URL spécifiée pour wget lors de sa mise dans CentOS. Pour le moment, j'ai pu le télécharger ci-dessous. (Seul CRF ++ a été authentifié sur le code google ...)
- | url |
---|---|
Mecab | http://cabocha.googlecode.com/files/cabocha-0.996.tar.bz2 |
CRF++ | https://googledrive.com/host/0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0/CRF++-0.58.tar.gz |
Cabocha | http://cabocha.googlecode.com/files/cabocha-0.996.tar.bz2 |
iconv conversion failed. skip this entry.... Je pense que l'avertissement suivant (?) Apparaîtra dans une rangée lorsque vous le faites.
iconv conversion failed. skip this entry....
Cela semble être un problème d'encodage. Dans ./configure, les options sont:
./configure --with-charset=utf8 --enable-utf8-only
J'obtiens ce genre d'erreur en faisant
error while loading shared libraries: libcrfpp.so.0: cannot open shared object file: No such file or directory
Cela dépend de l'environnement, mais ce n'est pas grave si vous ajoutez les informations de dépendance.
echo "/usr/local/lib" >> /etc/ld.so.conf.d/lib.conf
ldconfig
Je pense que string.split (cmd1 (str))
va en quelque sorte se mettre en colère.
Cette erreur se produit car le code cabocha ne prend pas en charge python3.
Une personne aimable a écrit le fichier de correctif, veuillez donc modifier la source en conséquence.
Pour le moment, comme ça. Je pourrais l'ajouter si quelque chose se reproduit.