Créer un environnement mecab (dictionnaire NEologd) avec Docker (ubuntu)

Récemment, je fais diverses analyses telles que l'acquisition de données par grattage, la réalisation d'analyses morphologiques avec mecab, etc.

Articles récents Regroupement de livres d'Aozora Bunko avec Doc2Vec Raclage et analyse négative / positive des articles en ligne de Bunharu

À ce moment-là, le type d'environnement utilisé pour l'analyse se trouve dans l'environnement Docker. Cette fois, je publierai le Dockerfile que j'utilise.

Base: ʻubuntu Inclus: ʻanaconda, mecab, NEologd, gensim, janome, Beautiful Soup, etc. Ingéniosité: j'ai défini NEologd comme dictionnaire par défaut. De cette façon, vous n'avez pas à spécifier le dictionnaire NEologd à chaque démarrage de mecab.

référence Cours udemy Docker de Kame-san ・ ・ ・ C'est la connaissance de base de mon Docker. Cours hautement recommandé. Page GitHub de NEologd ・ ・ ・ Plus fort dans la nomenclature appropriée que le dictionnaire par défaut. Modification du dictionnaire par défaut de MeCab [Mac] ・ ・ ・ Je l'ai utilisé comme référence lors de la spécification du dictionnaire par défaut de mecab.

FROM ubuntu:latest

RUN apt-get update && apt-get install -y \
  sudo \
  wget \
  vim \
  mecab \
  libmecab-dev \
  mecab-ipadic-utf8 \
  git \
  make \
  curl \
  xz-utils \
  file

WORKDIR /opt

RUN wget https://repo.anaconda.com/archive/Anaconda3-2020.07-Linux-x86_64.sh && \
  sh Anaconda3-2020.07-Linux-x86_64.sh -b -p /opt/anaconda3 && \
  rm -f Anaconda3-2020.07-Linux-x86_64.sh
ENV PATH /opt/anaconda3/bin:$PATH

RUN git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git ; exit 0
RUN cd mecab-ipadic-neologd && \
  ./bin/install-mecab-ipadic-neologd -n -y && \
  echo "dicdir=/usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd">/etc/mecabrc
RUN conda update -n base -c defaults conda

RUN pip install --upgrade pip && \
  pip install mecab-python3 \
  Janome \
  jaconv \
  tinysegmenter==0.3 \
  gensim \
  unidic-lite \
  japanize-matplotlib

RUN conda install -c conda-forge \
  newspaper3k && \
  conda install beautifulsoup4 \
  lxml \
  html5lib \
  requests

WORKDIR /work

CMD ["jupyter", "lab", "--ip=0.0.0.0", "--allow-root"]

Recommended Posts

Créer un environnement mecab (dictionnaire NEologd) avec Docker (ubuntu)
Créer un environnement Docker avec WSL
Créer un environnement local Couchbase avec Docker
Créer un environnement Node.js avec Docker
Créez un environnement Docker + Laravel avec Laradock
Créer un environnement de développement Wordpress avec Docker
[Docker] Construisez l'environnement d'exécution de Jupyter Lab avec Docker
Créer un environnement avec Docker sur AWS
Créer un environnement de vérification des opérations TensorFlow avec Docker
Comment créer un environnement Rails 6 avec Docker
Créez rapidement un environnement de développement WordPress avec Docker
[Rails] Comment créer un environnement avec Docker
Modèle: créer un environnement de développement Ruby / Rails avec un conteneur Docker (version Ubuntu)
Comment créer un environnement Docker avec Gradle pour IntelliJ
Créez un environnement Ruby2.7.x + Rails6.0.x + MySQL8.0.x avec Docker
Environnement Build Rails (API) x MySQL x Nuxt.js avec Docker
[Docker] Construction de l'environnement Rails 5.2 avec docker
Construire DynamoDB local avec Docker
Comment quitter Docker pour Mac et créer un environnement de développement Docker avec Ubuntu + Vagrant
Comment créer un environnement [TypeScript + Vue + Express + MySQL] avec Docker ~ Express ~
Créez un environnement Vue3 avec Docker!
Créer un environnement Node.js avec Docker Compose
Installer Java avec Docker basé sur Ubuntu 16.04
Créer un environnement Tomcat 8.5 avec Pleiades 4.8
Construction d'environnement avec Docker pour les débutants
Créer un environnement de vérification SolrCloud avec Docker
Créer un environnement de développement Jooby avec Eclipse
[Construction de l'environnement avec Docker] Rails 6 et MySQL 8
Créer un environnement de développement Unity sur docker
Créer un environnement de développement Go avec WSL2 + Docker Desktop + VSCode (Remote --Containers)
J'ai essayé de créer un environnement de serveur UML Plant avec Docker
Comment créer un environnement [TypeScript + Vue + Express + MySQL] avec Docker ~ MySQL ~
Comment créer un environnement Rails + Vue + MySQL avec Docker [dernière version 2020/09]
Créer un environnement de développement pour Django + MySQL + nginx avec Docker Compose
Comment créer un environnement [TypeScript + Vue + Express + MySQL] avec Docker ~ Sequelize ~
Créer un environnement de débogage sur un conteneur - Créer un environnement de développement local pour les didacticiels Rails avec Docker -
Construction de l'environnement GPU avec Docker [version d'octobre 2020]
Construction d'environnement de rails avec Docker (apocalypse personnelle)
Construction de Rails 6 et environnement PostgreSQL avec Docker
Créez un environnement de "développement d'API + vérification d'API à l'aide de Swagger UI" avec Docker
Construire un environnement Rails 6 + MySQL avec Docker compose