Qu'est-ce que la technologie de reconnaissance d'image?
La reconnaissance de texte, la reconnaissance faciale, etc. sont toutes des applications de la technologie de reconnaissance d'image. Cependant, tout cela est une application de base de la technologie de reconnaissance d'image. Une technologie de pointe est déjà capable de reconnaître s'il s'agit d'une photo de chien ou de chat. Comment as-tu fais ça? Dans la recherche d'experts, les êtres humains regardent le contour d'un objet avant de décider de ce qu'il est. La technologie de reconnaissance d'image est la même et le contour de l'image est d'abord reconnu.
Adit Deshpande, étudiant à l'Université de Californie, a écrit un article intitulé «Guide du débutant pour comprendre les réseaux de neurones convolutifs». Dans celui-ci, nous avons introduit l'algorithme de reconnaissance d'image et les causes de base d'une manière facile à comprendre pour les débutants.
Les ordinateurs convertissent les images en tableaux numériques, de sorte que la "reconnaissance d'image" est l'analyse de tableaux numériques. En général, vous pouvez réduire l'image (49 x 49 pixels) et convertir les informations de couleur de chaque pixel en une valeur de gris pour obtenir une matrice de 49 x 49 afin d'exclure des informations supplémentaires. Ensuite, sortez les petits blocs un par un en haut à gauche et calculez.
Exemple 1:
La figure de droite est une courbe et la figure de gauche est une matrice grise 7 x 7 de courbes. La valeur de gris du bord est élevée au niveau de la courbe, et tout le reste est "0".
La reconnaissance d'image sera désormais effectuée. Ci-dessous, une image d'une souris.
Prenez le bloc dans le coin supérieur gauche, convertissez-le en une matrice grise, multipliez les nombres au niveau des chevauchements de la matrice et additionnez jusqu'à 6600. C'est un chiffre assez important, mais que pouvez-vous expliquer?
La matrice de la tête du rat donne une valeur de 0.
Conclusion: Il a été conclu qu'il existe de nombreuses parties de correspondance d'image lorsque la valeur du résultat du calcul est élevée. Habituellement, de nombreux modes sont préparés à l'avance, le mode optimal est calculé pour chaque bloc, et finalement l'ensemble est jugé.
Recommended Posts