Principes de base de la technologie de reconnaissance d'image (pour les débutants)

Qu'est-ce que la technologie de reconnaissance d'image?

La reconnaissance de texte, la reconnaissance faciale, etc. sont toutes des applications de la technologie de reconnaissance d'image. Cependant, tout cela est une application de base de la technologie de reconnaissance d'image. Une technologie de pointe est déjà capable de reconnaître s'il s'agit d'une photo de chien ou de chat. Comment as-tu fais ça? Dans la recherche d'experts, les êtres humains regardent le contour d'un objet avant de décider de ce qu'il est. La technologie de reconnaissance d'image est la même et le contour de l'image est d'abord reconnu.

c3.png

Adit Deshpande, étudiant à l'Université de Californie, a écrit un article intitulé «Guide du débutant pour comprendre les réseaux de neurones convolutifs». Dans celui-ci, nous avons introduit l'algorithme de reconnaissance d'image et les causes de base d'une manière facile à comprendre pour les débutants.

Les ordinateurs convertissent les images en tableaux numériques, de sorte que la "reconnaissance d'image" est l'analyse de tableaux numériques. En général, vous pouvez réduire l'image (49 x 49 pixels) et convertir les informations de couleur de chaque pixel en une valeur de gris pour obtenir une matrice de 49 x 49 afin d'exclure des informations supplémentaires. Ensuite, sortez les petits blocs un par un en haut à gauche et calculez. c5.png

Exemple 1: c6.png

La figure de droite est une courbe et la figure de gauche est une matrice grise 7 x 7 de courbes. La valeur de gris du bord est élevée au niveau de la courbe, et tout le reste est "0".

La reconnaissance d'image sera désormais effectuée. Ci-dessous, une image d'une souris. c7.png

c8.png

Prenez le bloc dans le coin supérieur gauche, convertissez-le en une matrice grise, multipliez les nombres au niveau des chevauchements de la matrice et additionnez jusqu'à 6600. C'est un chiffre assez important, mais que pouvez-vous expliquer? c9.png

La matrice de la tête du rat donne une valeur de 0.

Conclusion: Il a été conclu qu'il existe de nombreuses parties de correspondance d'image lorsque la valeur du résultat du calcul est élevée. Habituellement, de nombreux modes sont préparés à l'avance, le mode optimal est calculé pour chaque bloc, et finalement l'ensemble est jugé.

Recommended Posts

Principes de base de la technologie de reconnaissance d'image (pour les débutants)
Implémentation du modèle Deep Learning pour la reconnaissance d'images
Histoire de base de l'héritage en Python (pour les débutants)
CNN (1) pour la classification des images (pour les débutants)
Application de la reconnaissance d'image CNN2
Grammaire de base Python pour les débutants
[À voir pour les débutants] Bases de Linux
Reconnaissance d'image des fruits avec VGG16
Python: principes de base de la reconnaissance d'image à l'aide de CNN
[Python] Compte-rendu de la réunion d'étude pour les débutants (7/15)
Python: Application de la reconnaissance d'image à l'aide de CNN
Fonctionnement Linux pour les débutants Résumé des commandes de base
Reconnaissance d'image
Pour les débutants de SageMaker - Liens matériels -
[Explication pour les débutants] Syntaxe et concept de base de TensorFlow
J'ai essayé la reconnaissance d'image de CIFAR-10 avec Keras-Learning-
J'ai essayé la reconnaissance d'image de CIFAR-10 avec la reconnaissance d'image Keras-
Lire et mettre en œuvre l'apprentissage résiduel profond pour la reconnaissance d'image
Traitement d'image? L'histoire du démarrage de Python pour
Compréhension facile de Python pour les tableaux et (pour les super débutants)
Outil pratique pour les débutants (en considération des idées)
Principes de base de Pandas pour les débutants ② Présentation des données de saisie
Image de fermeture
J'ai essayé le tutoriel MNIST de tensorflow pour les débutants.
Résumé des méthodes de prétraitement pour les débutants en Python (trame de données Pandas)
Exercice Python pour les débutants # 1 [Types de données de base / instructions If]
Recherche approximative du voisin le plus proche pour une analyse d'image similaire (pour les débutants) (1)
[Pour les débutants] Apprenez la grammaire de base Python gratuitement en 5 heures!
[Pour les débutants] Quantifier la similitude des phrases avec TF-IDF