Installez mecab sur le serveur partagé Sakura et appelez-le depuis python

Aperçu

Dans cet article Installez mecab avec UTF-8 sur le serveur partagé Sakura. Après cela, appelez mecab depuis python et essayez l'analyse morphologique. Le serveur de location Sakura ne dispose pas des privilèges root, donc Installez dans le répertoire utilisateur.

Conditions préalables

-Les commandes de la procédure sont décrites dans bash. Comment changer pour bash Consultez le supplément "Standardiser bash sur le serveur de location Sakura"!

Quoi installer

・ Corps Mecab (mecab-0.996) ・ Dictionnaire Mecab ・ Système de gestion de paquets Python pip ・ Mecab-python

procédure

Installation du corps mecab

(1) Téléchargez le corps mecab à partir du site suivant. http://taku910.github.io/mecab/#download

(2) Décompressez le corps du mecab Décompressez le corps avec la commande tar tar xvfz ./mecab-0.996.tar.gz

(3) Déplacer vers le répertoire décompressé cd mecab-0.996

(4) Compiler et construire Tapez la commande suivante pour installer dans le répertoire utilisateur ./configure --prefix=$HOME/local --with-charset=utf8 --enable-utf8-only

make make install

Dans mon environnement, il a été installé à l'emplacement suivant. ~/local/bin/mecab

(5) Vérifiez s'il est installé mecab -v S'il est installé normalement, vous pouvez taper la commande ci-dessus à "mecab of 0.996" Un journal comme celui-ci s'affiche.

Insérez le dictionnaire ipa

(1) Téléchargez le dictionnaire mecab et le dictionnaire ipa à partir des sites suivants. http://taku910.github.io/mecab/#download

(2) Décompressez le dictionnaire ipa tar xvzf mecab-ipadic-2.7.0-20070801.tar.gz

(3) Déplacer vers le dossier du dictionnaire cd mecab-ipadic-2.7.0-20070801

(4) Tapez la commande suivante pour installer dans le répertoire utilisateur Le code de caractère du dictionnaire est utf-8. La raison d'utiliser utf-8 est de l'appeler sur le WEB. ./configure --with-charset=utf8

Cependant, même si vous le définissez ici sur utf-8, après avoir exécuté mecab, Le code de caractère du résultat de sortie peut rester EUC.

Dans ce cas, dans "mecab-ipadic-2.7.0-20070801" Convertit les fichiers avec les extensions "csv" et "def" en UTF-8 et les écrase.

Commande de conversion en UTF-8 et commande de confirmation nkf -w --overwrite *.csv nkf -w --overwrite *.def nkf --guess *.*

référence Comment utiliser Mecab avec le serveur partagé Sakura, dictionnaire UTF-8 http://nymemo.com/sakura/258/

(5) Compiler et construire Tapez la commande suivante pour installer dans le répertoire utilisateur

make make install

Dans mon environnement, le dictionnaire a été installé à l'emplacement suivant. ~/local/lib/mecab/dic/ipadic

Contrôle de fonctionnement du mecab

Spécifiez le dictionnaire comme indiqué ci-dessous et démarrez mecab.

mecab -d ~/local/lib/mecab/dic/ipadic Le réglage du terminal est UTF-8.

En cas de succès, ce qui suit sera affiché.

[home@www1635 ~/local/etc]$ mecab -d ~/local/lib/mecab/dic/ipadic Des cuisses et des cuisses Nomenclature Sumomo, général, *, *, *, *, sumomo, sumomo, sumomo Mo assistant, commis, *, *, *, *, mo, mo, mo Nomenclature de la cuisse, général, *, *, *, *, cuisse, pêche, pêche Mo assistant, commis, *, *, *, *, mo, mo, mo Nomenclature de la cuisse, général, *, *, *, *, cuisse, pêche, pêche Auxiliaire, syndicalisation, *, *, *, *, de, non, non Dont nomenclature, non-indépendance, avocat possible, *, *, * EOS

Installez la bibliothèque python

Installez pip.

La raison de l'installation de pip est d'installer mecab-python à l'aide de pip.

easy_install --prefix=~/.local pip

Confirmez que pip est installé

[home@www1635 ~/local/etc]$ pip --version pip 9.0.1 from /home/homedir/.local/lib/python2.7/site-packages/pip-9.0.1-py2.7.egg (python 2.7)

installer mecab-python

pip install mecab-python --user La raison d'avoir --user est que le serveur Sakura n'a pas de privilèges root, donc installez-le dans le répertoire utilisateur.

Exécutez mecab avec python

Écrivez ce code source.

sample.py


# coding: UTF-8

import MeCab

#Spécifiez l'emplacement du dictionnaire (pour une raison quelconque, cela ne fonctionnera que si vous le spécifiez avec le chemin complet)
userdic_path="-d /home/homedir/local/lib/mecab/dic/ipadic"
t = MeCab.Tagger("-Ochasen " + userdic_path)

text = u'Des cuisses et des cuisses'
encoded_text = text.encode('utf-8')# 
meData = t.parse(encoded_text )
print meData

Une fois exécutée, l'instruction suivante sera sortie ʻA Sumomo Sumomo Nomenclature-General Auxiliaire Momo Momo Nez de cuisse pêche-général Auxiliaire Momo Momo Nez de cuisse pêche-général Union auxiliaire de Nono Nomenclature d'Uchi Uchi - Algorithme de non-indépendance possible EOS `

c'est tout! Ensuite, j'écrirai un article sur la façon d'afficher le résultat de l'exécution de MeCab sur un navigateur WEB.

Supplément

Standardiser bash sur le serveur de location Sakura http://note.sicafe.net/sakuraVPS/sakura_vimInstall.html

Recommended Posts

Installez mecab sur le serveur partagé Sakura et appelez-le depuis python
Installez lp_solve sur Mac OSX et appelez-le avec python.
Installez Mecab et CaboCha sur ubuntu16.04LTS afin qu'il puisse être utilisé à partir de la série python3
Installez le sélénium sur votre Mac et essayez-le avec python
Installez django sur python + anaconda et démarrez le serveur
Installez CaboCha dans l'environnement Ubuntu et appelez-le avec Python.
Installez Mecab et mecab-python3 sur Ubuntu 14.04
Remarques sur l'utilisation de MeCab depuis Python
Appeler C / C ++ depuis Python sur Mac
Comment installer OpenCV sur Cloud9 et l'exécuter en Python
De Python à l'utilisation de MeCab (et CaboCha)
Installer et configurer le serveur TigerVNC sous Linux
Installer Python3 sur le serveur mixhost [Actuellement NG]
Installez pyenv et Python 3.6.8 sur Ubuntu 18.04 LTS
Déployez le modèle de reconnaissance faciale Python sur Heroku et utilisez-le depuis Flutter ②
Déployez le modèle de reconnaissance faciale Python sur Heroku et utilisez-le depuis Flutter ①
Définissez cron à partir de 1 sur Ubuntu 16.04 (Sakura VPS) et exécutez régulièrement le programme python
[python] Envoyez l'image capturée de la caméra Web au serveur et enregistrez-la
Installez Python3 et Django sur Amazon Linux (EC2) et exécutez le serveur Web
MeCab de Python
Installez Chrome en ligne de commande sur Sakura VPS (Ubuntu) et lancez Chrome avec python à partir de l'affichage virtuel et du sélénium
Installez et exécutez Python3.5 + NumPy + SciPy sur Windows 10
Installez OpenCV 4.0 et Python 3.7 sur Windows 10 avec Anaconda
Lier PHP et Python à partir de zéro sur Laravel
Construire un environnement Python sur le serveur Sakura VPS
Installez MongoDB sur Ubuntu 16.04 et utilisez python
Installer Python et les bibliothèques pour Python sur MacOS Catalina
Installez la version ZIP Python et pip sur Windows 10
Jusqu'à ce que Python soit installé avec pythonbrew et que Flask s'exécute sur le serveur WSGI
Installer mecab sur Marvericks
Installer python sur WSL
Installez Python 3 sur Mac et créez un environnement [Definitive Edition]
[Python3] Prenez une capture d'écran d'une page Web sur le serveur et recadrez-la davantage
Installez Python sur Pidora.
Installez Scrapy sur python3
Installez Python sur Mac
Installer Python 3 dans un environnement Mac
Installer Python à partir de la source
Installez Python3.4 sur CentOS 6.6
Installez PyCall sur Raspberry PI et essayez d'utiliser la bibliothèque GPIO pour Python de Ruby
[Windows] [Python3] Installer python3 et Jupyter Notebook (anciennement ipython notebook) sous Windows
Installez python sur Windows
Recevoir des e-mails de Gmail et étiqueter avec Python3
Compilez et installez MySQL-python pour python2.7 sur Amazon Linux
Installez Python 2.7.3 sur CentOS 5.4
Installez Docker sur Arch Linux et exécutez-le à distance
Installez Python 3.3 sur Ubuntu 12.04
Installez pyenv sur Raspberry Pi pour gérer Python
Installez Python 3.4 sur Mac
Installer mecab sur Mac
Installez Python 3.6 sur Docker
Appelez l'API Hatena Blog depuis Python et enregistrez vos articles de blog individuellement sur votre PC
J'ai créé un serveur avec socket Python et ssl et j'ai essayé d'y accéder depuis le navigateur
Mettez Ubuntu dans Raspi, mettez Docker dessus et contrôlez GPIO avec python à partir du conteneur
Installer python3 et autour de la bibliothèque de calcul scientifique sur Ubuntu (virtualenv + pip)
Installez pyenv sur MacBookAir et basculez Python à utiliser
[Python] J'ai installé le jeu depuis pip et j'ai essayé de jouer
Installer python et Visual Studio Code sur Windows10 (version d'avril 2020)
Aller au langage pour voir et se souvenir de la partie 8 Appeler le langage GO à partir de Python
Appeler CPLEX depuis Python (DO cplex)