Faisons R-CNN avec Sklearn-theano

introduction

J'ai essayé d'utiliser BING avec OpenCV comme prétraitement de CNN [J'ai essayé d'utiliser la recherche sélective comme R-CNN] (http://qiita.com/Almond/items/7850cf81903fbe2a2c6c)

Jusqu'à présent, j'ai fait R-CNN en utilisant BING et la recherche sélective. Cependant, si vous faites CNN (processus de convolution), aimeriez-vous trouver une partie semblable à un objet à ce moment-là? Rassurez-vous, vous pouvez le faire! Donc, cette fois, nous allons estimer la position avec CNN. (* Le GitHub de Sklearn-theano décrit la localisation de l'estimation --position, je vais donc utiliser cette expression ci-dessous.)

Qu'est-ce que Sklearn-theano?

Sklearn-theano est une bibliothèque qui facilite l'apprentissage en profondeur en faisant abstraction de Theano, un cadre d'apprentissage en profondeur. Un similaire est Keras. Ceci est populaire et a l'air plutôt bien, mais cette fois, il est sans nom? J'essaierai d'utiliser Sklearn-theano.

Sklearn-theano peut faire ça

Comme mentionné ci-dessus, Sklearn-theano peut facilement classer et estimer les images ainsi que l'estimation de la position. De plus, vous pouvez facilement essayer les bibliothèques de lieux célèbres tels que OverFeat, AlexNet, VGGNet, GoogLeNet. Je souhaite résoudre des problèmes pratiques en utilisant divers modèles formés. Pourquoi n'essayez-vous pas d'utiliser Sklearn-theano?

Utilisons-le immédiatement

https://github.com/sklearn-theano/sklearn-theano Clonez le référentiel ci-dessus et installez-le avec la commande python setup.py install. De plus, ce package est requis, donc si vous ne l'avez pas installé, installez-le d'abord. ・ Numpy ・ Scipy ・ Theano ・ Scikit-learn ・ Pilow

résultat

Cette fois, j'ai essayé d'utiliser plot_single_localization.py dans Sample. La position de la bête est estimée dans la dernière image. Pour l'expliquer assez grossièrement, nous estimons d'abord les points susceptibles d'être des objets dans la zone carrée jaune, puis nous détectons le groupe de points rassemblé comme objet final. Veuillez consulter cette page pour le processus de détection détaillé.

figure_sloth_example.png

Au fait, le temps de traitement est d'environ 310 secondes ... environ 5 minutes! !! !! !! longue. .. .. Le communiqué officiel dit 352,80 secondes, il ne semble donc pas y avoir d'erreur.

Résumé

Cette fois, j'ai utilisé une bibliothèque mineure appelée Sklearn-theano pour estimer la position avec CNN. Si cela ne vous dérange pas de prendre le temps, vous voudrez peut-être l'essayer. Cependant, je pense que c'est difficile, inutile de le dire, lorsque la vitesse est requise. ** Si quelqu'un connaît une méthode générale de détection d'objets qui peut résister au temps réel, merci de me le faire savoir **

Recommended Posts

Faisons R-CNN avec Sklearn-theano
Faisons du scraping d'images avec Python
Faisons la manipulation des données MySQL avec Python
Web scraping avec Python (prévisions météo)
Web scraping avec Python (cours de l'action)
Faisons Raspberry Pi?
Faites Houdini avec Python3! !! !!
Jouons avec la 4e dimension 4e
Faites Django avec CodeStar (Python3.6.8, Django2.2.9)
Jouons avec les données Amedas - Partie 1
Faites Django avec CodeStar (Python3.8, Django2.1.15)
Faisons Othello avec wxPython
Jouons avec les données Amedas - Partie 4
Écrivons python avec cinema4d.
Effectuer le cryptage AES avec DJango
Jouons avec les données Amedas - Partie 3
Jouons avec les données Amedas - Partie 2
Construisons git-cat avec Python
Faites quelque chose comme fuzzing avec acceptableRegex.py
Faites du SSH en plusieurs étapes avec Fabric
Ne changez pas avec pyenv global!
Faisons "Hello World" en 40 langues! !!
Que faire avec l'installation de Magics
Faisons une interface graphique avec python.
HTTPS avec Django et Let's Encrypt
Apprenons Deep SEA avec Selene
Faisons une rupture de bloc avec wxPython
Jouons avec Excel avec Python [Débutant]
Pour faire une récursion avec Python2
Que faire avec la sortie de PYTHON?
Je veux faire ○○ avec les Pandas
Faisons un graphe avec python! !!
Faisons un spacon avec xCAT
Faisons l'IA d'Othello avec Chainer-Part 2-
Reconnaissons les émotions avec Azure Face
Analysons la voix avec Python # 1 FFT
Python | Ce que vous pouvez faire avec Python