Reference
Résumé de la procédure du réseau neuronal pour reconnaître l'image à l'aide des données d'apprentissage de MNIST.
MNIST Un ensemble de données de nombres manuscrits de "0" à "9". Chaque nombre est divisé en 28 $ \ times28 $ pixels, et chaque nombre est codé par couleur en 8 bits 256 étapes. Il peut être facilement lu par l'API fournie par keras.
>>> from keras.datasets import mnist
>>> (x_train, y_train), (x_test, y_test) = mnist.load_data()
>>> x_train[0]
array([[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0],
[ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0],
・ ・ ・(réduction)
>>> y_train[0]
5
Convertissez les informations d'entrée en un tableau unidimensionnel.
>>> x_train = x_train.reshape(60000, 784)
>>> x_train[0]
array([ 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
En outre, les données de réponse correctes sont converties en encodage à chaud (variable factice). Puisqu'elle est comparée à la valeur d'apprentissage en tant que probabilité dans la couche de sortie finale, par exemple, si elle est 5, la matrice est [0,0,0,0,0,1,0,0,0,0,]. Cela peut également être créé à l'aide de l'API keras.
>>> y_train = keras.utils.to_categorical(y_train, 10)
>>> y_test = keras.utils.to_categorical(y_test, 10)
--Couche d'entrée --MNIST Une information de pixel 28 × 28 = 784 pixels est utilisée comme information d'entrée. --Couche cachée ――Tuning est nécessaire pour le nombre de couches à utiliser --Couche de sortie --10 nœuds correspondant à "0" à "9", la valeur de sortie correspond à la probabilité de ce nombre
Sur la base du codage simple du didacticiel, nous passerons à une reconnaissance d'image plus pratique. Le but ultime du défi est d'extraire le contour de la personne.
Recommended Posts