En exécutant le didacticiel TensorFlow Expert Deep MNIST for Experts, le processus de «mise en commun» était aussi déroutant que le processus de «pliage». Comme le pliage, ce n'est pas un terme général pour les diplômés des arts libéraux, et j'ai un peu trébuché, mais c'est facile à comprendre. C'est plus facile que le pliage car il n'utilise pas de filtre comme le pliage. "[Explication pour les débutants] Tutoriel TensorFlow Deep MNIST" Dans l'article, sur le traitement du réseau neuronal de convolution, "[Explication pour les débutants] Introduction au traitement de convolution (Explication dans TensorFlow) " explique la spécialisation du traitement de convolution, veuillez donc vous y référer. * Publié en référence à la sortie d'image par TensorBoard (2017/7/27) </ sup>
[[Explication pour les débutants] Tutoriel TensorFlow Deep MNIST]](http://qiita.com/FukuharaYohei/items/0aef74a0411273705512) Comme expliqué dans l'article, le processus de "pooling" organise grossièrement les caractéristiques de l'image. .. Non seulement les images, mais aussi l'audio et les données sont bien, mais les images sont plus visuelles et plus faciles à comprendre, donc je vais expliquer en utilisant des images.
Le processus de convolution filtre pour faire ressortir les fonctionnalités. En utilisant l'image comme entrée et en utilisant le filtre, l'image pour le nombre de filtres est sortie. Lors de l'utilisation de données MNIST, c'est comme suit.
C'était comme ça quand j'ai organisé la mise en commun des images d'entrée / sortie de traitement mises en commun sur TensorBoard. Contrairement au processus de pliage, il est facile à comprendre car il n'est que rugueux.
La partie suivante du didacticiel TensorFlow Expert Deep MNIST for Experts est le processus de mise en commun. La même chose est vraie pour les première et deuxième couches. Il peut être implémenté à ce niveau à l'aide de l'API TensorFlow.
# Max Pooling
def max_pool_2x2(x):
return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
Si vous utilisez une image de barre diagonale de 4 verticales x 4 horizontales x 1 couleur (noir uniquement) comme exemple d'image d'entrée et effectuez un traitement de convolution avant la mise en commun, le résultat sera le suivant. Afin de rendre le résultat facile à comprendre, il est exprimé par deux, "1" et "-1".
Max Pooling Ensuite, c'est la mise en commun du sujet principal. Le didacticiel TensorFlow Expert Deep MNIST for Experts utilise Max Pooling comme type de regroupement. Max Pooling sélectionne simplement la valeur maximale pour chaque plage et la compresse. Comme le montre la figure, les caractéristiques de la barre diagonale pourraient être compressées de moitié tout en laissant les caractéristiques de 4 (vertical) x 4 (horizontal) à 2 (vertical) x 2 (horizontal). C'est ce qui a été décrit comme "l'organisation approximative des fonctionnalités". À propos, il existe également une mise en commun moyenne, auquel cas c'est comme le montre la figure ci-dessous.
Recommended Posts