Cet article explique comment utiliser l'API Vision de GCP en ignorant les tâches difficiles. Même pour la première fois, vous pouvez l'utiliser si vous suivez l'image.
Google Vision API https://cloud.google.com/vision/docs/ocr/?hl=ja (J'ai pu éviter d'installer le SDK Google Cloud. Grâce à l'installation de google-cloud-vision avec pip?)
Windows10 Installer Python 3.7 Créer un compte GCP Préparer l'image que vous souhaitez lire
Tout d'abord, procurez-vous la bibliothèque d'API Google Vision. Entrez la commande suivante.
pip install --upgrade google-cloud-vision
Après l'installation, nous allons le tester. Ouvrez Python
from google.cloud import vision
Éxécuter. Si cela ne provoque pas d'erreur, tout va bien. Si non
Python 3.7.7 (default, May 6 2020, 11:45:54) [MSC v.1916 64 bit (AMD64)] :: Anaconda, Inc. on win32 Type "help", "copyright", "credits" or "license" for more information. >>> from google.cloud import vision Traceback (most recent call last): File "
", line 1, in ImportError: cannot import name 'vision' from 'google.cloud' (unknown location)
Il sera affiché.
Cette fois, nous allons mettre en place un nouveau projet GCP. Appuyez sur Nouveau projet. Créez un nom de projet avec un nom descriptif.
Après avoir créé le projet, activez l'API Vision. Veuillez cliquer dans l'ordre des numéros d'image.
Entrez "google vision api" dans la fenêtre de recherche. Cliquez sur l'élément affiché. Cliquez sur le bouton Activer.
Sélectionnez en fonction du nombre dans l'image. Entrez un nom de compte de service approprié. L'ID sera saisi automatiquement, vous pouvez donc le laisser tel quel. Veuillez sélectionner un rôle approprié. L'écran suivant sera complété tel quel. Un compte de service a été ajouté. Cliquez sur image.png Et sélectionnez "Créer une clé". Sélectionnez JSON et appuyez sur le bouton Terminer. Déplacez le fichier téléchargé vers n'importe quel emplacement.
Définissez les variables d'environnement. Variables: GOOGLE_APPLICATION_CREDENTIALS Valeur: emplacement et nom du fichier json téléchargé (exemple: c: \ user \ xxxxxx \ desctop \ xxxxxxx.json)
La procédure de réglage est la suivante. Procédez selon les nombres de l'image.
Modifiez le code source provenant de Github.
detext.py
"""Detects text in the file."""
from google.cloud import vision
import io
client = vision.ImageAnnotatorClient()
# [START vision_python_migration_text_detection]
path = "C:\\Users\\xxxx\\Desktop\\gcptest\\xxxxx.png "
with io.open(path, 'rb') as image_file:
content = image_file.read()
image = vision.types.Image(content=content)
response = client.text_detection(image=image)
texts = response.text_annotations
print('Texts:')
for text in texts:
print('\n"{}"'.format(text.description))
vertices = (['({},{})'.format(vertex.x, vertex.y)
for vertex in text.bounding_poly.vertices])
print('bounds: {}'.format(','.join(vertices)))
if response.error.message:
raise Exception(
'{}\nFor more info on error messages, check: '
'https://cloud.google.com/apis/design/errors'.format(
response.error.message))
Vous pouvez modifier l'image en changeant la partie de "path =" C: \ Users \ xxxx \ Desktop \ gcptest \ xxxxx.png "" sur la 7ème ligne du code source. L'image suivante est utilisée comme exemple.
Résultat de sortie
"Faites de votre mieux au Japon Collation au chocolat Meiji Montagne de champignons Saveur de fraise parfumée seulement TOKTO 0 20 ES Enfant) ©Tokyo 2020 " bounds: (1,66),(745,66),(745,954),(1,954) «Kanbare» bounds: (72,80),(351,73),(353,152),(74,159) "Nippon" bounds: (353,73),(619,66),(621,145),(355,152) «Meiji» bounds: (208,151),(305,150),(305,190),(208,191) "Chocolat" bounds: (307,151),(405,150),(405,189),(307,190) "goûter" bounds: (394,156),(535,155),(535,184),(394,185) "champignon" bounds: (33,167),(471,157),(475,354),(37,364) "de" bounds: (473,157),(569,155),(573,352),(477,354) "Montagne" bounds: (571,155),(735,151),(739,348),(575,352) «Kaoru» bounds: (131,403),(314,390),(322,502),(139,516) "Fraise" bounds: (315,390),(596,370),(604,482),(323,503) "goût" bounds: (598,370),(671,365),(679,476),(606,482) "seulement" bounds: (637,551),(736,527),(745,564),(646,588) "TOKTO" bounds: (236,697),(260,690),(263,701),(239,708) "0" bounds: (262,691),(277,687),(280,696),(265,701) "20" bounds: (1,804),(34,804),(34,829),(1,829) "ES" bounds: (1,828),(16,828),(16,844),(1,844) "Enfant" bounds: (1,910),(18,910),(18,932),(1,932) ")" bounds: (19,912),(24,912),(24,927),(19,927) "©Tokyo" bounds: (72,924),(150,921),(151,951),(73,954) "2020" bounds: (157,921),(210,919),(211,949),(158,951)
Comme prévu
Recommended Posts