Bonjour Licht. J'ai obtenu le ** jeu de données de reconnaissance de caractères japonais ** vendu à l 'Environmental Research Institute, donc pour les débutants en apprentissage profond utilisant le jeu de données Je publierai le tutoriel. Nous allons essayer de développer un moteur de reconnaissance de caractères japonais.
Comme vous pouvez le voir sur l'image ci-dessous, c'est un tutoriel qui garantit l'effondrement de Gestalt, mais j'aimerais faire de mon mieux sans faute.
Cet article est ・ Je veux commencer le Deep Learning! ・ Je veux faire un didacticiel autre que la reconnaissance des numéros de mnist! ・ Je souhaite en savoir plus sur les technologies liées au Deep Learning! ・ Je souhaite développer l'OCR japonais par moi-même!
J'écris pour ceux qui disent. Ceci est expliqué dans le schéma ci-dessous.
chapitre | Titre |
---|---|
Chapitre 1 | Construire un environnement Deep Learning basé sur le chainer |
Chapitre 2 | Création d'un modèle de prédiction Deep Learning par Machine Learning |
chapitre 3 | Reconnaissance de caractères à l'aide d'un modèle |
Chapitre 4 | Amélioration de la précision de la reconnaissance en élargissant les données |
Chapitre 5 | Introduction à Neural Net et explication du code source |
Chapitre 6 | Amélioration de l'efficacité d'apprentissage en sélectionnant Optimizer |
Chapitre 7 | TTA,Amélioration de l'efficacité de l'apprentissage par la normalisation des lots |
Si vous êtes complètement nouveau dans le Deep Learning, veuillez essayer jusqu'au chapitre 4 car vous voulez quand même voir des objets en mouvement. Le chapitre 5 et ci-dessous sont destinés à ceux qui souhaitent en savoir plus sur le Deep Learning.
** le chainer est un OSS domestique **. Surtout, il est facile à utiliser et à comprendre, et même si vous posez une question sur le chainer sur Google Group, il répondra immédiatement et gratuitement.
La partie principale est basée sur Mac, mais j'expliquerai chacun d'eux selon Windows à tout moment (bien que la seule différence soit la préparation de l'environnement). ・ Spécifications de la machine: mémoire 4 Go ou plus -Série Python2.7, pip doit être installé
Au terminal
sudo pip install chainer
Entrez chainer1.6.0, filelock2.0.5, nose1.3.7, numpy1.10.4, protobuf 2.6.1 en vrac.
sudo pip install scipy
Entrez pour installer scipy 0.17.0.
Veuillez également installer la série Opencv 2.4.X en vous référant à cet article.
À l'invite de commande
pip install chainer
Entrez chainer1.6.0, filelock2.0.5, nose1.3.7, numpy1.10.4, protobuf 2.6.1 en vrac.
pip install scipy
Entrez pour installer scipy 0.17.0. Démarrez l'invite de commande en mode administrateur si nécessaire. Veuillez également installer la série Opencv 2.4.X en vous référant à cet article.
Achetez (1000 yens) l'ensemble de données Hirakana sur le site Web de l'Institut de recherche environnementale et téléchargez-le. Créez un répertoire appelé "HIRAGANA_NN" sur votre bureau et décompressez-le.
-DESKTOP -HIRAGANA_NN -304a -304b ・ ・ (Référence) C'est OK si cela ressemble à l'image ci-dessous.
De plus, les répertoires tels que 304a indiquent l'Unicode de chaque pseudonyme simple et le contenu est le suivant.
Vous êtes maintenant prêt. J'aimerais passer à l'apprentissage automatique à partir du prochain chapitre 2!
chapitre | Titre |
---|---|
Chapitre 1 | Construire un environnement Deep Learning basé sur le chainer |
Chapitre 2 | Création d'un modèle de prédiction Deep Learning par Machine Learning |
chapitre 3 | Reconnaissance de caractères à l'aide d'un modèle |
Chapitre 4 | Amélioration de la précision de la reconnaissance en élargissant les données |
Chapitre 5 | Introduction à Neural Net et explication du code source |
Chapitre 6 | Amélioration de l'efficacité d'apprentissage en sélectionnant Optimizer |
Chapitre 7 | TTA,Amélioration de l'efficacité de l'apprentissage par la normalisation des lots |