Dans ce domaine, moi, un étranger, je n'ai pas du tout étudié «la théorie de l'apprentissage automatique». Je vais faire l'IA d'Othello. Cliquez ici pour le site référencé ・ Implémentation ultra-simple de DQN (Deep Q Network) avec TensorFlow-Introduction-
Si vous expliquez le concept grossièrement Deux intelligences artificielles affrontent sérieusement Othello, Sauvez cette dernière IA et combattez-moi (humain). Voilà pourquoi.
Mon environnement est le suivant. OS ・ Ubuntu Environnement de développement ・ Python 3.5
Je pense que ça marche dans cet environnement Création d'un environnement de développement Ubuntu python sur Google Cloud Platform
Tout d'abord, téléchargez le code source.
La source est ici.
$ git clone https://github.com/sasaco/tf-dqn-reversi.git
Lorsque l'environnement est prêt, accédez au répertoire du code source et appuyez sur train.py pour commencer l'apprentissage.
python
$ cd tf-dqn-reversi
$ python train.py
Si vous voyez le journal suivant, vous apprenez correctement.
python
player:1 | pos:32 | LOSS: 0.0000 | Q_MAX: 0.0041
player:2 | pos:15 | LOSS: 0.0000 | Q_MAX: 0.0009
…
layer:2 is only pos:56
player:2 | pos:56 | LOSS: 0.0000 | Q_MAX: 0.8607
EPOCH: 999/999 | WIN: player2
winner is player2
Il faudra plusieurs heures pour terminer l'étude. Testons avec le modèle entraîné.
python
$ python FightWithAI.py
------------- GAME START ---------------
***tour de l'utilisateur ○***
0 1 2 3 4 5 6 7
8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23
24 25 26 ○ ● 29 30 31
32 33 34 ● ○ 37 38 39
40 41 42 43 44 45 46 47
48 49 50 51 52 53 54 55
56 57 58 59 60 61 62 63
Veuillez saisir le numéro
[43, 34, 29, 20]
>>>
Si le jeu démarre comme ci-dessus, vous réussissez. Cela a-t-il fonctionné correctement? Le résultat du match sera écrit en ~ Iza Battle Edition ~.
La prochaine fois fournira la version d'implémentation.
Recommended Posts