J'ai essayé d'utiliser BING avec OpenCV comme prétraitement de CNN [J'ai essayé d'utiliser la recherche sélective comme R-CNN] (http://qiita.com/Almond/items/7850cf81903fbe2a2c6c)
Jusqu'à présent, j'ai fait R-CNN en utilisant BING et la recherche sélective. Cependant, si vous faites CNN (processus de convolution), aimeriez-vous trouver une partie semblable à un objet à ce moment-là? Rassurez-vous, vous pouvez le faire! Donc, cette fois, nous allons estimer la position avec CNN. (* Le GitHub de Sklearn-theano décrit la localisation de l'estimation --position, je vais donc utiliser cette expression ci-dessous.)
Sklearn-theano est une bibliothèque qui facilite l'apprentissage en profondeur en faisant abstraction de Theano, un cadre d'apprentissage en profondeur. Un similaire est Keras. Ceci est populaire et a l'air plutôt bien, mais cette fois, il est sans nom? J'essaierai d'utiliser Sklearn-theano.
Comme mentionné ci-dessus, Sklearn-theano peut facilement classer et estimer les images ainsi que l'estimation de la position. De plus, vous pouvez facilement essayer les bibliothèques de lieux célèbres tels que OverFeat, AlexNet, VGGNet, GoogLeNet. Je souhaite résoudre des problèmes pratiques en utilisant divers modèles formés. Pourquoi n'essayez-vous pas d'utiliser Sklearn-theano?
https://github.com/sklearn-theano/sklearn-theano Clonez le référentiel ci-dessus et installez-le avec la commande python setup.py install. De plus, ce package est requis, donc si vous ne l'avez pas installé, installez-le d'abord. ・ Numpy ・ Scipy ・ Theano ・ Scikit-learn ・ Pilow
Cette fois, j'ai essayé d'utiliser plot_single_localization.py dans Sample. La position de la bête est estimée dans la dernière image. Pour l'expliquer assez grossièrement, nous estimons d'abord les points susceptibles d'être des objets dans la zone carrée jaune, puis nous détectons le groupe de points rassemblé comme objet final. Veuillez consulter cette page pour le processus de détection détaillé.
Au fait, le temps de traitement est d'environ 310 secondes ... environ 5 minutes! !! !! !! longue. .. .. Le communiqué officiel dit 352,80 secondes, il ne semble donc pas y avoir d'erreur.
Cette fois, j'ai utilisé une bibliothèque mineure appelée Sklearn-theano pour estimer la position avec CNN. Si cela ne vous dérange pas de prendre le temps, vous voudrez peut-être l'essayer. Cependant, je pense que c'est difficile, inutile de le dire, lorsque la vitesse est requise. ** Si quelqu'un connaît une méthode générale de détection d'objets qui peut résister au temps réel, merci de me le faire savoir **
Recommended Posts