Créez un environnement d'apprentissage automatique Python sur votre ordinateur portable avec un conteneur.
Cette fois, nous allons créer un conteneur qui peut utiliser fastText et Python3 principalement comme environnement d'apprentissage automatique basé sur du texte.
https://qiita.com/penpenta/items/3b7a0f1e27bbab56a95f
Tout d'abord, démarrez l'image du conteneur de base. La commande execute ici doit être la même que la commande pour exécuter l'image de conteneur construite. Cette fois, nous utiliserons l'image CentOS pour créer fastText à l'intérieur du conteneur.
docker run -it -v /c/temp/data:/data --rm centos:centos8 /bin/bash
Vous pouvez créer avec Dockerfile depuis le début, mais vous pouvez obtenir une erreur d'installation. Ce travail est effectué pour vérifier progressivement l'environnement.
dnf -y install python36
yum install -y git make gcc gcc-c++
yum install -y python36-devel
cd /usr/local/src
git clone https://github.com/facebookresearch/fastText.git
cd fastText
pip3 install .
python3
import fasttext
exit()
docker export {ID de l'image} > {nom de fichier}.tar
Installez le package standard.
pip3 install numpy pandas matplotlib scikit-learn
Installez les packages requis pour le traitement japonais. Le dictionnaire n'est pas obligatoire, vous pouvez donc l'ignorer.
rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
yum -y makecache
yum -y install mecab mecab-ipadic
yum -y install --nogpgcheck mecab-devel
pip3 install mecab-python3 neologdn emoji
yum install -y diffutils patch which file openssl
cd /usr/local/src
git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd
./bin/install-mecab-ipadic-neologd -n -y
Cette fois, je veux l'utiliser pour un usage personnel et toujours utiliser une nouvelle version de package, donc j'exporterai l'environnement vers le Dockerfile de travail jusqu'à présent.
Dockerfile
FROM centos:centos8
SHELL ["/bin/bash", "-c"]
#Python Install
RUN dnf -y install python36
#fastText Build
RUN yum install -y git make gcc gcc-c++
RUN yum install -y python36-devel
WORKDIR /usr/local/src
RUN git clone https://github.com/facebookresearch/fastText.git
WORKDIR /usr/local/src/fastText
RUN pip3 install .
#Install Python Package
RUN pip3 install numpy pandas matplotlib scikit-learn
RUN rpm -ivh http://packages.groonga.org/centos/groonga-release-1.1.0-1.noarch.rpm
RUN yum -y makecache
RUN yum -y install --nogpgcheck mecab mecab-ipadic mecab-devel
RUN pip3 install mecab-python3 neologdn emoji
#Install Mecab Dictionary
# RUN yum install -y diffutils patch which file openssl
#
# WORKDIR /usr/local/src
# RUN git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git
# WORKDIR /usr/local/src/mecab-ipadic-neologd
# RUN ./bin/install-mecab-ipadic-neologd -n -y
docker build -t fasttext/centos8:v1.0 .
docker run -it -v /c/temp/data:/data --rm fasttext/centos8:v1.0 /bin/bash
En suivant les étapes ci-dessous, vous avez créé un environnement d'apprentissage automatique Python dans un conteneur sur votre ordinateur portable.
Avec le travail à distance, il n'était pas possible de toujours se connecter au VPN interne, et le travail de développement sur le serveur de développement était difficile, mais cet environnement l'a résolu.
Comme il faut du temps pour apprendre sur un ordinateur portable, il existe des problèmes tels que «les ressources sont occupées pour l'apprentissage» et «ne peut pas s'arrêter», mais si le même conteneur est préparé à l'avance sur le serveur de développement, «moins sur un ordinateur portable» Il peut être résolu en suivant la procédure de "Vérifier le fonctionnement avec l'époque → Augmenter l'époque sur le serveur de développement et apprendre". Il est également possible d'accroche le commit du code source et d'exécuter automatiquement l'apprentissage sur le serveur de développement. Je vais résumer l'article séparément à ce sujet.
Recommended Posts