Diffusez la reconnaissance vocale à l'aide de l'API gRPC Google Cloud Speech avec python3 sur Mac!

Explication préalable

Dernières informations (7 novembre 2017)

Il semble que l'interface de l'API google a été modifiée et qu'elle ne fonctionne pas telle quelle. Si vous êtes nouveau dans l'utilisation de la reconnaissance vocale de flux à l'avenir, veuillez vous référer à l'article suivant de @delete. https://qiita.com/delete/items/395776c6843d67fd65fd

Articles que j'ai écrits plus tôt

C'est ci-dessous.

Je souhaite effectuer une reconnaissance vocale de flux à l'aide de l'API gRPC de Google Cloud Speech! (Avec un simple VAD)] http://qiita.com/sayonari/items/a70118a468483967ad34

Explication de cet article

Dans cet article, j'ai fait la reconnaissance vocale Google dans un nouvel environnement, mais cela n'a pas fonctionné, donc je vais laisser une note de quand je l'ai installé depuis le début. Nous n'avons pas été en mesure de le revérifier correctement, donc si vous trouvez des opinions ou des corrections, n'hésitez pas à nous donner votre avis.

Histoire principale

Environnement d'exécution

--Machine: MacBook Pro (Retina, 13 pouces, début 2015)

Installation

google cloud API dashboard https://console.cloud.google.com/?hl=ja La méthode de mise à disposition de l'API vocale avec l'API Google Cloud est assez ennuyeuse, mais elle regorge d'informations, veuillez donc la rechercher sur Google vous-même.

Créer un projet

Créez un projet avec votre nom préféré. J'ai fait un projet appelé GoogleCloudAPI-ASRtest. Si vous pouvez utiliser SpeechAPI, l'ID dans l'API sera affiché, alors souvenez-vous-en.

Installation de la bibliothèque

pip install google.cloud.speech

Installez la commande gcloud

https://cloud.google.com/sdk/docs/quickstart-mac-os-x?hl=ja

Exécutez ʻinstall.sh`

Initialisation du SDK

gcloud init

Il vous sera demandé "Vous devez vous connecter pour continuer. Voulez-vous vous connecter (O / n)?", Alors entrez Y.

Le navigateur démarre, alors connectez-vous avec le compte Google enregistré avec l'API.

Sous "Choisir le projet cloud à utiliser:", le nom du projet API est répertorié avec le numéro, alors sélectionnez le projet dans lequel SpeechAPI est enregistré.

「Do you want to configure Google Compute Engine (https://cloud.google.com/compute) paramètres (O / n)? ”Sélectionnez le serveur sur Y. Il a été changé en "[2] asia-east1-b".

Ajouter le chemin vers PYTHONPATH

pip install gcloud

Ajoutez le répertoire installé à PYTHONPATH

Dans mon cas, c'était comme suit. export PYTHONPATH="/Users/nishimura/.pyenv/versions/3.6.1/lib/python3.6/site-packages:$PYTHONPATH"

Si vous ajoutez ceci à ~ / .bash_profile, il sera exécuté automatiquement à chaque fois, ce qui est pratique.

Paramètres par défaut des informations d'identification

gcloud auth application-default login

Le navigateur démarre, alors connectez-vous avec votre compte Google. Approbation de la demande.

Exécuter google sample

https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client

Si vous exécutez transcribe_streaming_mic.py, vous pouvez reconnaître la voix en anglais.

Je veux reconnaître la voix japonaise!

Spécifiez directement dans le programme (dans la fonction principale) où config est défini.

language_code='ja-JP'

Je veux donner une reconnaissance aux candidats (indices de phrase)!

Pourquoi ne pas réécrire la configuration dans la fonction principale comme ça?

    config = types.RecognitionConfig(
        encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
        sample_rate_hertz=RATE,
        language_code='ja-JP',
        speech_contexts=[speech.types.SpeechContext(
            phrasesHints=["Kita est venu","Vraiment"]
        )]
    )

Cependant, comme la "lecture" n'est pas donnée, elle n'est pas bien reconnue lorsqu'elle est écrite en kanji. Pardon. Si quelqu'un sait "comment donner une lecture", merci de me le faire savoir m (_ _) m

Pages référencées non mentionnées ci-dessus

Manuel officiel https://media.readthedocs.org/pdf/google-cloud-python/latest/google-cloud-python.pdf

Recommended Posts

Diffusez la reconnaissance vocale à l'aide de l'API gRPC Google Cloud Speech avec python3 sur Mac!
Procédure de transcription vocale à l'aide de Python et de l'API Google Cloud Speech
Reconnaissance vocale des fichiers par l'API Google Speech v2 à l'aide de Python
Reconnaissance vocale en streaming avec l'API Google Cloud Speech
Procédure de transcription vocale à l'aide de l'API Google Cloud Speech
Reconnaissance vocale des fichiers wav avec Google Cloud Speech API Beta
[Python3] Google translate google translation sans utiliser l'API
J'ai essayé d'utiliser l'API de reconnaissance vocale docomo et l'API Google Speech en Java
API Google Cloud Speech et Amazon Transcribe
Exemple d'API Google Cloud Vision pour python
Essayez d'utiliser Python avec Google Cloud Functions
Utiliser l'API Google Cloud Vision de Python
Créer une feuille de calcul Google à l'aide de l'API Python / Google Data
python sur mac
Transcription vocale automatique avec l'API Google Cloud Speech
J'ai essayé d'utiliser l'API Google Cloud Vision
Tweet (API 1.1) avec Google App Engine pour Python
Liste des référentiels de sortie à l'aide de l'API Github sur Mac
[GoogleCloudPlatform] Utiliser l'API Google Cloud avec la bibliothèque cliente d'API
Importez un fichier JPG à l'aide de l'API Google Drive en Python
Installez Python sur Mac
Installer Python 3 dans un environnement Mac
[Python] Obtenez des données insight à l'aide de l'API Google My Business
Reconnaissance vocale avec Python
Créez un environnement Python sur votre Mac en utilisant pyenv
Installez Python 3.4 sur Mac
Notes minimales lors de l'utilisation de Python sur Mac (édition pyenv)
Notes minimales lors de l'utilisation de Python sur Mac (édition Homebrew)
Utilisation du SDK NAOqi 2.4.2 Python avec Mac OS X El Capitan
Créer un environnement de développement Ubuntu python sur Google Cloud Platform
Construire un environnement Python sur un Mac, jusqu'au point d'utiliser Jupyter Lab
Accédez aux feuilles de calcul Google en utilisant python avec raspberry pi (pour vous-même)
Une note quand j'ai touché l'API de reconnaissance faciale de Microsoft avec Python
Essayez de juger des photos de plats à l'aide de l'API Google Cloud Vision
Publions l'API de super résolution à l'aide de Google Cloud Platform
Facile sur Mac! Tracé de la réponse d'étape unitaire à l'aide de Python
Jouez avec l'API de données YouTube v3 à l'aide du client Python de l'API Google
Reconnaissance vocale par Python MFCC
Installer pygame sur python3.4 sur Mac
Reconnaissance de l'âge à l'aide de l'API de Pepper
Manipulation de python sur mac
Mettez à jour le python que vous aviez sur votre Mac à 3.7-> 3.8
Installez pandas 0.14 sur python3.4 [sur Mac]
Remarques sur l'installation de Python sur votre Mac
Diffusion sur LINE en utilisant python
Conseils relatifs aux API Google Drive (Python)
Utiliser OpenCV avec Python @Mac
Créez un classement de jeu sur le cloud Alibaba en utilisant Python et Redis
Playbook Ansible pour configurer les préférences Python à l'aide de pyenv sur Mac
[SEO] Flux / exemple de code lors de l'utilisation de l'API Google Analytics en Python
[Ruby on Rails] Affichage et épinglage de GoolgeMAP à l'aide de l'API Google
Construire un environnement Python sur Mac
Imprimez un PDF à l'aide de Google Cloud Print. (GoogleAPI)
Si Python sur Mac disparaît
Acquisition de données à l'aide de l'API googlemap de python
[Python] Accédez à l'API Google Translation
Remarques sur l'utilisation de MeCab depuis Python