Renforcer l'apprentissage 8 Essayez d'utiliser l'interface utilisateur de Chainer

On suppose que jusqu'à Renforcement de l'apprentissage 7 est terminé. Afin de réaliser un apprentissage intensif, vous voudrez voir le processus d'apprentissage. Utilisez l'outil de visualisation / gestion d'expériences de Chainer "Chainer UI".

ChainerUI https://github.com/chainer/chainerui https://research.preferred.jp/2017/12/chainerui-release/

Installez l'interface utilisateur de Chainer.

pip install chainerui
chainerui db create
chainerui db upgrade

Accédez au répertoire parent, puis créez le projet.

chainerui project create -d CartPole
chainerui server

Accédez ensuite à http: // localhost: 5000 / avec un navigateur Web. L'ordre ici est important.

scores.txt ne sera pas lu. Par conséquent, ajoutez le code suivant à train.py ou exécutez-le avec un autre code.

convert.py


import pandas as pd
import json
import codecs
import numpy as np

scores = pd.read_table('result/scores.txt')
columns = scores.columns  #informations d'en-tête

data_list = []
for column in columns:
    data_list.append([column, ''])
data_hash = dict(data_list) #Modèle de hachage pour chaque donnée de station

log_json = []
for score in np.array(scores):
    score_hash = data_hash.copy()
    for i in range(columns.size):
        score_hash[columns[i]] = score[i]
    log_json.append(score_hash)

print(log_json)
f = codecs.open('result/log', 'w', 'utf-8')
json.dump(log_json, f, indent=4, ensure_ascii=False)
f.close

Il semble que print (log_json) ne soit pas nécessaire, mais lorsque je l'exécute avec jupyter notebook, la fin du fichier journal est étrange à moins que je ne le mette. Vous pouvez maintenant voir le graphique dans l'interface utilisateur du chainer.

ChainerUI a 5 axes X fixes du graphique, "epoch", "iteration", "episode", "step", "elapsed_time". scores.txt est légèrement différent, je vais donc modifier ChainerUI. Remodelage du démon dans la 9ème sérialisation.

Tout d'abord, concernant l'emplacement du fichier, il y a anaconda3 dans le dossier personnel. Regardez à l'intérieur ici. userFolder/anaconda3/envs/chainer/lib/python3.7/site-packages/chainerui Voici le programme. userFolder/anaconda3/envs/chainer/lib/python3.7/site-packages/chainerui/static/dist/chainerui.js Ouvrez ce fichier. Dans ce dossier T = ["epoch", "iteration", "episode", "step", "elapsed_time"], , T = ["epoch", "iteration", "episode", "step", "elapsed_time","steps","episodes","elapsed"], Réécrivez dans. Vous pouvez maintenant spécifier l'axe X sous forme d'étapes, etc.

Recommended Posts

Renforcer l'apprentissage 8 Essayez d'utiliser l'interface utilisateur de Chainer
Apprentissage par renforcement 10 Essayez d'utiliser un réseau neuronal formé.
Renforcer l'apprentissage 6 First Chainer RL
Apprentissage par renforcement 5 Essayez de programmer CartPole?
Renforcer l'apprentissage 13 Essayez Mountain_car avec ChainerRL.
J'ai essayé l'apprentissage par renforcement avec PyBrain
Essayez l'apprentissage de la représentation commune avec le chainer
Essayez avec Chainer Deep Q Learning - Lancement
Essayez l'algorithme d'apprentissage amélioré standard d'OpenAI PPO
Renforcer l'apprentissage 11 Essayez OpenAI acrobot avec ChainerRL.
Essayez d'utiliser Tkinter
[Introduction] Renforcer l'apprentissage
Essayez d'utiliser docker-py
Essayez d'utiliser Cookiecutter
Essayez d'utiliser des géopandas
Essayez d'utiliser Selenium
Essayez d'utiliser scipy
Apprentissage par renforcement futur_1
Essayez d'utiliser pandas.DataFrame
Essayez d'utiliser django-swiftbrowser
Essayez d'utiliser matplotlib
Essayez d'utiliser tf.metrics
Essayez d'utiliser PyODE
Python: essayez d'utiliser l'interface utilisateur sur Pythonista 3 sur iPad
Essayez d'utiliser le bloc-notes Jupyter à partir d'Azure Machine Learning
Essayez d'écrire du code à partir de 1 en utilisant le chainer du cadre d'apprentissage automatique (édition mnist)
Apprentissage amélioré 1 installation de Python
Renforcer l'apprentissage 3 Installation d'OpenAI
Essayez d'utiliser virtualenv (virtualenvwrapper)
Renforcer l'apprentissage de la troisième ligne
J'ai essayé d'apprendre mon propre ensemble de données en utilisant Chainer Trainer
Essayez d'utiliser virtualenv maintenant
[Renforcer l'apprentissage] Tâche de bandit
[Kaggle] Essayez d'utiliser LGBM
Essayez d'utiliser l'analyseur de flux de Python.
Essayez d'utiliser Tkinter de Python
Apprentissage amélioré Python + Unity (apprentissage)
[Apprentissage automatique] Essayez de détecter des objets à l'aide de la recherche sélective
Mise en œuvre de l'apprentissage en série de Chainer à l'aide de mini-lots de longueur variable
Précautions lors de l'utilisation de Chainer
Essayez d'utiliser Tweepy [Python2.7]
Renforcer l'apprentissage 1 édition introductive
Essayez d'utiliser collate_fn de Pytorch
Maintenant, essayons la reconnaissance faciale avec Chainer (phase d'apprentissage)
[Apprentissage de renforcement d'introduction] Renforcement de l'apprentissage pour bouger pour le moment
Essayez l'apprentissage Q dans une bataille de style Drakue [Introduction au renforcement de l'apprentissage]
estimation personnelle en temps réel (apprentissage en utilisant le GPU localement)
Renforcer l'apprentissage 18 Colaboratory + Acrobat + ChainerRL
Essayez l'apprentissage en profondeur avec TensorFlow
Apprentissage amélioré 7 Sortie du journal des données d'apprentissage
Essayez d'utiliser PythonTex avec Texpad.
[Python] Essayez d'utiliser le canevas de Tkinter
Essayez d'utiliser l'image Docker de Jupyter
Essayez d'utiliser scikit-learn (1) - Clustering K par méthode moyenne
Essayez d'implémenter RBM avec chainer.
Renforcer l'apprentissage 17 Colaboratory + CartPole + ChainerRL
Renforcer l'apprentissage 28 collaboratif + OpenAI + chainerRL
Essayez d'utiliser matplotlib avec PyCharm
Essayez d'utiliser Azure Logic Apps
Renforcer l'apprentissage 19 Colaboratory + Mountain_car + ChainerRL