J'ai décidé de faire du machine learning au travail, alors notez la méthode de configuration.
Installez d'abord les modules requis pour installer python.
sudo aptitude install gcc g++ make openssl libssl-dev libbz2-dev libreadline-dev libsqlite3-dev
Utilisez pyenv et pyenv-virtualenv afin que les versions et les bibliothèques puissent être commutées pour chaque répertoire.
git clone https://github.com/yyuu/pyenv.git ~/.pyenv
git clone https://github.com/yyuu/pyenv-virtualenv.git ~/.pyenv/plugins/pyenv-virtualenv
echo 'export PYENV_ROOT="$HOME/.pyenv"' >> ~/.bashrc
echo 'export PATH="$PYENV_ROOT/bin:$PATH"' >> ~/.bashrc
echo 'eval "$(pyenv init -)"' >> ~/.bashrc
echo 'eval "$(pyenv virtualenv-init -)"' >> ~/.bashrc
source ~/.bashrc
pyenv install 3.5.1
pyenv rehash
pyenv global 3.5.1
mkdir work
cd work
pyenv virtualenv 3.5.1 3.5.1_work
pyenv local 3.5.1_work
pip install numpy
pip install scipy
pip install scikit-learn
pip install gensim
pip freeze
Si vous cochez avec, la liste des bibliothèques installées sera affichée uniquement dans le dossier de travail.
pip freeze
boto==2.40.0
bz2file==0.98
gensim==0.12.4
...
mecab
Puisque je vais faire du système de texte, j'installe également mecab.
sudo aptitude install libmecab-dev
sudo aptitude install mecab mecab-ipadic-utf8
mecab --version
pip install mecab-python3