Introduction au Deep Learning (2) - Essayez votre propre régression non linéaire avec Chainer-

introduction

Dans le précédent «Introduction au Deep Learning (1) -Understanding and using Chainer-», nous avons résumé comment utiliser Chainer. .. Si vous suivez la référence, vous découvrirez comment l'utiliser. Lorsque j'étudie l'apprentissage automatique, j'assume un problème de régression simple et je décide moi-même que je peux le comprendre et l'utiliser lorsque je peux créer un modèle de prédiction pour celui-ci.

Par conséquent, cette fois, spécifiquement, nous allons générer des données pour une fonction sin non linéaire et effectuer une régression non linéaire en utilisant un modèle construit avec Chainer. Si vous avez terminé toutes les étapes jusqu'à ce point, vous pourrez peut-être comprendre même si vous passez à la version avancée telle que la discrimination d'image.

Environnement de développement

・ Système d'exploitation: Mac OS X EL Capitan (10.11.5) · Python 2.7.12: Anaconda 4.1.1 (x86_64) ・ Chainer 1.12.0

Ce but

Comme le montre l'image ci-dessous, construisez un modèle de régression non linéaire capable de capturer parfaitement la fonction sin.

ゴール.png

Construire un modèle de régression non linéaire

Aperçu du programme

MyChain.py


# -*- coding: utf-8 -*-
from chainer import Chain
import chainer.links as L
import chainer.functions as F

class MyChain(Chain):

    def __init__(self):
        super(MyChain, self).__init__(
            l1 = L.Linear(1, 100),
            l2 = L.Linear(100, 30),
            l3 = L.Linear(30, 1)
        )

    def predict(self, x):
        h1 = F.relu(self.l1(x))
        h2 = F.relu(self.l2(h1))
        return self.l3(h2)

example.py


# -*- coding: utf-8 -*-

#Calcul numérique lié
import math
import random
import numpy as np
import matplotlib.pyplot as plt
# chainer
from chainer import Chain, Variable
import chainer.functions as F
import chainer.links as L
from chainer import optimizers
from MyChain import MyChain

#Graine aléatoire fixe
random.seed(1)

#Génération d'échantillons de données
#La fonction sin comme fonction vraie
x, y = [], []
for i in np.linspace(-3,3,100):
    x.append([i])
    y.append([math.sin(i)])  #Vraie fonction
#Déclarer à nouveau comme variable de chaîne
x = Variable(np.array(x, dtype=np.float32))
y = Variable(np.array(y, dtype=np.float32))

#Déclarer le modèle NN
model = MyChain()

#Calcul de la fonction de perte
#Erreur auto-quadrillée dans la fonction de perte(MSE)utilisation
def forward(x, y, model):
    t = model.predict(x)
    loss = F.mean_squared_error(t, y)
    return loss

#optimiseur de chaîne
#Adam est utilisé pour l'algorithme d'optimisation
optimizer = optimizers.Adam()
#Passer les paramètres du modèle à l'optimiseur
optimizer.setup(model)

#Répéter l'apprentissage des paramètres
for i in range(0,1000):
    loss = forward(x, y, model)
    print(loss.data)  #Afficher le MSE actuel
    optimizer.update(forward, x, y, model)

#terrain
t = model.predict(x)
plt.plot(x.data, y.data)
plt.scatter(x.data, t.data)
plt.grid(which='major',color='gray',linestyle='-')
plt.ylim(-1.5, 1.5)
plt.xlim(-4, 4)
plt.show()

Génération d'échantillons de données

Générez des données sur les enseignants pour créer ce modèle de régression non linéaire. Cette fois, nous utiliserons la fonction sin avec 1 entrée et 1 sortie.

#Génération d'échantillons de données
#La fonction sin comme fonction vraie
x, y = [], []
for i in np.linspace(-3,3,100):
    x.append([i])
    y.append([math.sin(i)])  #Vraie fonction
#Déclarer à nouveau comme variable de chaîne
x = Variable(np.array(x, dtype=np.float32))
y = Variable(np.array(y, dtype=np.float32))

Définition du modèle

Créez un modèle de Deep Learning avec Chainer. Cette fois, nous avons une structure à quatre couches composée d'une couche d'entrée, d'une couche cachée 1, d'une couche cachée 2 et d'une couche de sortie. J'ai décidé le nombre de nœuds de manière appropriée (j'ai écrit précédent ici, mais c'est une expérience et une intuition). Si vous êtes intéressé, vous pouvez modifier la valeur ici. La raison pour laquelle il y a deux couches cachées est que lorsque je suis revenu à une couche, les caractéristiques n'étaient pas bien capturées, alors je l'ai encore augmentée.

MyChain.py


# -*- coding: utf-8 -*-
from chainer import Chain
import chainer.links as L
import chainer.functions as F

class MyChain(Chain):

    def __init__(self):
        super(MyChain, self).__init__(
            l1 = L.Linear(1, 100),
            l2 = L.Linear(100, 30),
            l3 = L.Linear(30, 1)
        )

    def predict(self, x):
        h1 = F.relu(self.l1(x))
        h2 = F.relu(self.l2(h1))
        return self.l3(h2)

Le fait est que vous utilisez relu pour la fonction d'activation. Il n'y a pas si longtemps, il était standard d'utiliser la fonction sigmoïde pour cette fonction d'activation, mais récemment, lors de l'apprentissage des paramètres par la méthode de propagation d'erreur, le problème que le taux d'apprentissage diminue à mesure qu'il va vers l'arrière. Il semble que relu soit souvent utilisé pour éviter. Je ne connais ce domaine que par le ressenti, donc j'ai besoin d'étudier un peu plus. Il existe divers autres articles de commentaires sur la fonction d'activation, veuillez donc les consulter. Référence: [Machine learning] J'expliquerai en essayant le framework d'apprentissage profond Chainer.

Confirmer en situation non apprise

J'ai essayé de voir ce qui se passait dans une situation où je n'avais pas du tout appris. Je pense que vous pourrez saisir le ressenti général en regardant non seulement le résultat final mais aussi les progrès.

##Déclarer le modèle NN
model = MyChain()

#terrain
t = model.predict(x)
plt.plot(x.data, y.data)
plt.scatter(x.data, t.data)
plt.grid(which='major',color='gray',linestyle='-')
plt.ylim(-1.5, 1.5)
plt.xlim(-4, 4)
plt.show()
スクリーンショット 2016-08-08 15.49.58.png

Dans la situation non apprise, vous pouvez voir que les caractéristiques de la fonction vraie ne sont pas du tout capturées.

Paramètres du train

Pour entraîner les paramètres, définissez d'abord la fonction de perte. Cette fois, nous utiliserons l'erreur quadratique moyenne (MSE) comme fonction de perte.

{\rm MSE} = \dfrac{1}{N} \sum_{n=1}^{N} \left( \hat{y}_{n} - y_{n} \right)^{2}
#Calcul de la fonction de perte
#Erreur auto-quadrillée dans la fonction de perte(MSE)utilisation
def forward(x, y, model):
    t = model.predict(x)
    loss = F.mean_squared_error(t, y)
    return loss

En définissant cette fonction de perte, Chainer peut calculer automatiquement le gradient de l'optimiseur.

#optimiseur de chaîne
#Adam est utilisé pour l'algorithme d'optimisation
optimizer = optimizers.Adam()
#Passer les paramètres du modèle à l'optimiseur
optimizer.setup(model)
#Mise à jour du dégradé
optimizer.update(forward, x, y, model)

C'est la fin du flux de base.

Répéter l'apprentissage

En répétant plusieurs fois le précédent ```optimizer.update () '' ``, il convergera vers un bon paramètre. Cette fois, les données des enseignants sont entraînées plusieurs fois avec les mêmes données, mais à l'origine, en tant que données par lots, certaines sont extraites de l'échantillon de population, elles sont formées en tant que données d'enseignants et un autre échantillon est regroupé au cycle suivant. Le flux consiste à les utiliser comme données.

#Répéter l'apprentissage des paramètres
for i in range(0,1000):
    loss = forward(x, y, model)
    print(loss.data)  #Afficher le MSE actuel
    optimizer.update(forward, x, y, model)

スクリーンショット 2016-08-08 16.16.36.png

Vous pouvez voir que l'erreur auto-quadrillée diminue à mesure que l'apprentissage est répété. Après avoir terminé la formation, j'ai pu me rapprocher de la fonction de manière très fluide.

ゴール.png

référence

    1. Référence officielle de Chainer Il y avait diverses choses écrites en japonais, mais j'ai souvent rencontré des parties qui ne pouvaient pas être traitées en raison de changements de version, etc., donc c'était la plus stable en anglais.
  1. Introduction au Deep Learning (1) - Comprendre et utiliser Chainer-

prime

Nous vous attendons pour nous suivre! Qiita: Carat Yoshizaki twitter:@carat_yoshizaki Blog Hatena: Blog Carat COO Page d'accueil: Carat

Service de professeur à domicile "Kikagaku" où vous pouvez apprendre l'apprentissage automatique en tête à tête N'hésitez pas à nous contacter si vous êtes intéressé par "Kikagaku" où vous pouvez apprendre "mathématiques → programmation → application Web" à la fois.

Recommended Posts

Introduction au Deep Learning (2) - Essayez votre propre régression non linéaire avec Chainer-
[Introduction au style GAN] Apprentissage unique de l'animation avec votre propre machine ♬
Essayez de créer votre propre AWS-SDK avec bash
Essayez l'apprentissage en profondeur avec TensorFlow
Essayez le Deep Learning avec FPGA
Apprentissage par renforcement profond 1 Introduction au renforcement de l'apprentissage
Introduction au Deep Learning ~ Rétropropagation ~
Essayez de créer un réseau de neurones / d'apprentissage en profondeur avec scratch
[Evangelion] Essayez de générer automatiquement des lignes de type Asuka avec Deep Learning
Essayez le Deep Learning avec les concombres FPGA-Select
Introduction à l'apprentissage en profondeur ~ Approximation des fonctions ~
Essayez l'apprentissage en profondeur avec TensorFlow Partie 2
Introduction à l'apprentissage profond ~ Préparation au codage ~
Essayez l'apprentissage de la représentation commune avec le chainer
Introduction au Deep Learning ~ Dropout Edition ~
Introduction au Deep Learning ~ Propagation vers l'avant ~
Introduction à l'apprentissage profond ~ Expérience CNN ~
[Renforcer l'apprentissage] DQN avec votre propre bibliothèque
Classez les visages d'anime avec l'apprentissage en profondeur avec Chainer
Introduction au Deep Learning ~ Pliage et mise en commun ~
Essayez les prévisions de prix Bitcoin avec Deep Learning
Créez votre propre PC pour un apprentissage en profondeur
Essayez l'apprentissage profond de la génomique avec Kipoi
Pour importer votre propre module avec jupyter
[Introduction à l'apprentissage automatique] Jusqu'à ce que vous exécutiez l'exemple de code avec chainer
Mettez vos propres données d'image dans Deep Learning et jouez avec
[Python] Introduction facile à l'apprentissage automatique avec python (SVM)
[Introduction à StyleGAN2] Apprentissage indépendant avec 10 visages d'anime ♬
Développez et gonflez votre propre ensemble de données Deep Learning
Introduction à l'apprentissage profond ~ Fonction de localisation et de perte ~
Étapes pour installer votre propre bibliothèque avec pip
Introduction au Deep Learning (1) --Chainer est expliqué d'une manière facile à comprendre pour les débutants-
Mémo d'apprentissage Python pour l'apprentissage automatique par Chainer Chapitres 11 et 12 Introduction à Pandas Matplotlib
Mémo pour créer votre propre Box avec le Python de Pepper
Essayez d'améliorer votre propre quiz d'introduction avec Python
Essayez de prédire le taux de change (FX) avec un apprentissage automatique non approfondi
Essayez de mettre des LED dans votre propre PC (légèrement)
Introduction à Private Chainer
Essayez la régression avec TensorFlow
Introduction à l'apprentissage automatique
Maintenant, essayons la reconnaissance faciale avec Chainer (phase d'apprentissage)
Introduction au Deep Learning pour la première fois (Chainer) Reconnaissance des caractères japonais Chapitre 1 [Construction de l'environnement]
J'ai essayé de faire d'Othello AI que j'ai appris 7,2 millions de mains par apprentissage profond avec Chainer
Essayez de faire une stratégie de blackjack en renforçant l'apprentissage (③ Renforcer l'apprentissage dans votre propre environnement OpenAI Gym))
Essayez d'évaluer les performances du modèle d'apprentissage automatique / de régression
Introduction à l'apprentissage automatique avec scikit-learn - De l'acquisition de données à l'optimisation des paramètres
Essayez de trier vos propres objets avec des files d'attente prioritaires en Python
Reconnaissez votre patron avec Deep Learning et masquez l'écran
J'ai essayé d'implémenter ListNet d'apprentissage de rang avec Chainer
Apprentissage automatique pour apprendre avec Nogisaka 46 et Keyakizaka 46 Partie 1 Introduction
J'ai capturé le projet Toho avec Deep Learning ... je le voulais.
[Apprentissage de renforcement d'introduction] Renforcement de l'apprentissage pour bouger pour le moment
Essayez l'apprentissage Q dans une bataille de style Drakue [Introduction au renforcement de l'apprentissage]
Apprentissage par renforcement 23 Créez et utilisez votre propre module avec Colaboratory
J'ai essayé d'écrire dans un modèle de langage profondément appris
Essayez d'implémenter la régression linéaire à l'aide de Pytorch avec Google Colaboratory
Essayez de défier le sol par récursif
[Mémorandum d'apprentissage] Introduction à vim
Une introduction à l'apprentissage automatique