Apprentissage par renforcement 5 Essayez de programmer CartPole?

On suppose que jusqu'au renforcement de l'apprentissage 4 a été achevé.

Faisons une programmation simple.

CartPole2.py


import gym
env = gym.make('CartPole-v0')
for i in range(20):
    observation = env.reset()
    for t in range(100):
        env.render()
        action = 0
        if observation[2]>0:
            action = 1
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode{} finished after {} timesteps".format(i, t+1))
            break
env.close()

CartPole.py se déplaçait au hasard. La différence avec CartPole.py est que vous souhaitez modifier l'action en raison de la différence d'observation. Cela devient un contrôle de rétroaction.

Recommended Posts

Apprentissage par renforcement 5 Essayez de programmer CartPole?
Renforcer l'apprentissage 17 Colaboratory + CartPole + ChainerRL
Renforcer l'apprentissage 4 CartPole première étape
Renforcer l'apprentissage 13 Essayez Mountain_car avec ChainerRL.
Renforcer l'apprentissage 22 Colaboratory + CartPole + ChainerRL + A3C
Renforcer l'apprentissage 8 Essayez d'utiliser l'interface utilisateur de Chainer
Renforcer l'apprentissage 24 Colaboratory + CartPole + ChainerRL + ACER
Apprentissage par renforcement 3 Méthode de planification dynamique / méthode TD
[Introduction] Renforcer l'apprentissage
Apprentissage par renforcement futur_2
Apprentissage par renforcement futur_1
Essayez l'algorithme d'apprentissage amélioré standard d'OpenAI PPO
Renforcer l'apprentissage 11 Essayez OpenAI acrobot avec ChainerRL.
Apprentissage par renforcement 10 Essayez d'utiliser un réseau neuronal formé.
Apprentissage amélioré 1 installation de Python
Renforcer l'apprentissage 3 Installation d'OpenAI
Renforcer l'apprentissage de la troisième ligne
[Renforcer l'apprentissage] Tâche de bandit
Apprentissage amélioré Python + Unity (apprentissage)
Renforcer l'apprentissage 1 édition introductive
Renforcer l'apprentissage 18 Colaboratory + Acrobat + ChainerRL
Essayez l'apprentissage en profondeur avec TensorFlow
Apprentissage amélioré 7 Sortie du journal des données d'apprentissage
Deep Learning Gaiden ~ Programmation GPU ~
Essayez la programmation Linux normale, partie 7
Renforcer l'apprentissage 28 collaboratif + OpenAI + chainerRL
Essayez de programmer avec un shell!
Essayez la programmation GUI avec Hy
Renforcer l'apprentissage 19 Colaboratory + Mountain_car + ChainerRL
Renforcement de l'apprentissage 2 Installation de chainerrl
[Renforcer l'apprentissage] Suivi par multi-agents
Renforcer l'apprentissage 6 First Chainer RL
Essayez la programmation Linux normale, partie 2
Apprentissage amélioré à partir de Python
Renforcer l'apprentissage 20 Colaboratoire + Pendule + ChainerRL
Essayez le Deep Learning avec FPGA
Apprentissage par renforcement 9 Remodelage magique ChainerRL
Renforcer l'apprentissage Apprendre d'aujourd'hui
Essayez la programmation Linux normale, partie 4
Programmation Python Machine Learning> Mots-clés
Essayez la programmation Linux normale, partie 6
[Apprentissage de renforcement d'introduction] Renforcement de l'apprentissage pour bouger pour le moment
Apprentissage par renforcement profond 1 Introduction au renforcement de l'apprentissage
Premier mois d'apprentissage en programmation
Essayez l'apprentissage Q dans une bataille de style Drakue [Introduction au renforcement de l'apprentissage]
Essayez le machine learning à la légère avec Kaggle
Apprentissage par renforcement profond 2 Mise en œuvre de l'apprentissage par renforcement
DeepMind Enhanced Learning Framework Acme
Apprentissage par renforcement: accélérer l'itération de la valeur
Essayez de faire une stratégie de blackjack en renforçant l'apprentissage ((1) Implémentation du blackjack)
Renforcer l'apprentissage 21 Colaboratoire + Pendule + ChainerRL + A2C
Essayez le Deep Learning avec les concombres FPGA-Select
TF2RL: bibliothèque d'apprentissage améliorée pour TensorFlow2.x
Construction d'un environnement d'apprentissage amélioré Python + Unity
Essayez l'apprentissage en profondeur avec TensorFlow Partie 2
Les débutants en apprentissage automatique essaient la régression linéaire
Explorez le labyrinthe avec l'apprentissage augmenté
SVM essayant l'apprentissage automatique avec scikit-learn
[Apprentissage automatique] Essayez d'étudier une forêt aléatoire
Deep Strengthening Learning 3 Édition pratique: Briser des blocs