J'ai essayé l'extraction de texte (OCR) dans Ruby à l'aide de l'API Vision (modèle d'apprentissage automatique formé)

Qu'est-ce que Vision API?

L'API Google Cloud Vision fournit un puissant modèle d'apprentissage automatique pré-formé via l'API REST et l'API RPC. L'attribution d'étiquettes aux images vous permet de classer rapidement les images dans des millions de catégories prédéfinies. Détecte les objets et les visages, lit le texte imprimé et les entrées manuscrites et crée des métadonnées utiles dans le catalogue d'images. (Extrait du Document officiel)

Image soumise à l'analyse

Image capturée (format PNG) de Assign Navi Top Page

anavi.png

résultat de l'analyse

$ bundle exec rake cloud_vision:text['app/assets/images/anavi.png']
assign navi
Nouvelle façon de travailler
Matière/Trouvez des talents
Mode d'emploi
À propos du service
S'identifier
Inscription des membres
Projets informatiques, rencontres avec des ressources humaines externes
Efficacité avec la technologie
00

Vous pouvez extraire du texte avec une précision assez élevée (^^)

Code créé cette fois

lib/tasks/cloud_vision.rake


##Comment appeler
## $ bundle exec rake cloud_vision:text[image_file] # image_déposer'Chemin du fichier image ici'

#Chargement de la bibliothèque cliente Google Cloud
require "google/cloud/vision"

namespace :cloud_vision do
  desc 'Run OCR.'
  task :text, [:image_file] do |task, args|
    return unless args[:image_file]

    #Instancier le client
    image_annotator = Google::Cloud::Vision.image_annotator

    #Exécuter l'OCR
    response = image_annotator.text_detection(
      image: args[:image_file],
      max_results: 1 # optional, defaults to 10
    )

    #Affichage des résultats OCR
    response.responses.each do |res|
      res.text_annotations.each do |text|
        puts text.description
      end
    end
  end
end

Les variables d'environnement sont décrites dans dotenv

#.fichier env
GOOGLE_CLOUD_PROJECT="Entrez l'ID du projet ici"
GOOGLE_APPLICATION_CREDENTIALS="Décrivez le chemin d'accès au fichier json de clé d'authentification pour accéder à l'API Vision"

Procédure d'installation

La procédure de configuration sera bientôt ajoutée.

Les références

Using the Vision API with Ruby

LGTM pour les suivis et les articles encourage les publications quotidiennes. Le plus chaud en un clic, merci. m (_ _) m

Recommended Posts

J'ai essayé l'extraction de texte (OCR) dans Ruby à l'aide de l'API Vision (modèle d'apprentissage automatique formé)
J'ai essayé d'utiliser l'API Elasticsearch en Java
J'ai essayé d'utiliser l'API Java8 Stream
J'ai essayé d'utiliser JWT en Java
J'ai essayé un problème de calendrier avec Ruby
J'ai essayé le machine learning OSS d'Oracle "Tribuo"
[Pour les débutants] J'ai essayé d'utiliser DBUnit avec Eclipse
[Pour les débutants] J'ai essayé d'utiliser JUnit 5 avec Eclipse
J'ai fait un blackjack avec Ruby (j'ai essayé d'utiliser minitest)
Essayez d'utiliser l'API Cloud Vision de GCP en Java
[API] J'ai essayé d'utiliser l'API de recherche par code postal
J'ai essayé d'utiliser une connexion à une base de données dans le développement Android
Essayé l'API Toot et Streaming de Mastodon en Java
[Apprentissage automatique] J'ai essayé la détection d'objets avec Create ML [détection d'objets]
J'ai essayé d'utiliser l'instruction Extended for en Java