Il semble que l'interface de l'API google a été modifiée et qu'elle ne fonctionne pas telle quelle. Si vous êtes nouveau dans l'utilisation de la reconnaissance vocale de flux à l'avenir, veuillez vous référer à l'article suivant de @delete. https://qiita.com/delete/items/395776c6843d67fd65fd
C'est ci-dessous.
Je souhaite effectuer une reconnaissance vocale de flux à l'aide de l'API gRPC de Google Cloud Speech! (Avec un simple VAD)] http://qiita.com/sayonari/items/a70118a468483967ad34
Dans cet article, j'ai fait la reconnaissance vocale Google dans un nouvel environnement, mais cela n'a pas fonctionné, donc je vais laisser une note de quand je l'ai installé depuis le début. Nous n'avons pas été en mesure de le revérifier correctement, donc si vous trouvez des opinions ou des corrections, n'hésitez pas à nous donner votre avis.
--Machine: MacBook Pro (Retina, 13 pouces, début 2015)
google cloud API dashboard https://console.cloud.google.com/?hl=ja La méthode de mise à disposition de l'API vocale avec l'API Google Cloud est assez ennuyeuse, mais elle regorge d'informations, veuillez donc la rechercher sur Google vous-même.
Créez un projet avec votre nom préféré.
J'ai fait un projet appelé GoogleCloudAPI-ASRtest
.
Si vous pouvez utiliser SpeechAPI, l'ID dans l'API sera affiché, alors souvenez-vous-en.
pip install google.cloud.speech
https://cloud.google.com/sdk/docs/quickstart-mac-os-x?hl=ja
Exécutez ʻinstall.sh`
gcloud init
Il vous sera demandé "Vous devez vous connecter pour continuer. Voulez-vous vous connecter (O / n)?", Alors entrez Y.
Le navigateur démarre, alors connectez-vous avec le compte Google enregistré avec l'API.
Sous "Choisir le projet cloud à utiliser:", le nom du projet API est répertorié avec le numéro, alors sélectionnez le projet dans lequel SpeechAPI est enregistré.
「Do you want to configure Google Compute Engine (https://cloud.google.com/compute) paramètres (O / n)? ”Sélectionnez le serveur sur Y. Il a été changé en "[2] asia-east1-b".
pip install gcloud
Ajoutez le répertoire installé à PYTHONPATH
Dans mon cas, c'était comme suit.
export PYTHONPATH="/Users/nishimura/.pyenv/versions/3.6.1/lib/python3.6/site-packages:$PYTHONPATH"
Si vous ajoutez ceci à ~ / .bash_profile
, il sera exécuté automatiquement à chaque fois, ce qui est pratique.
gcloud auth application-default login
Le navigateur démarre, alors connectez-vous avec votre compte Google. Approbation de la demande.
https://github.com/GoogleCloudPlatform/python-docs-samples/tree/master/speech/cloud-client
Si vous exécutez transcribe_streaming_mic.py
, vous pouvez reconnaître la voix en anglais.
Spécifiez directement dans le programme (dans la fonction principale) où config est défini.
language_code='ja-JP'
Pourquoi ne pas réécrire la configuration dans la fonction principale comme ça?
config = types.RecognitionConfig(
encoding=enums.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=RATE,
language_code='ja-JP',
speech_contexts=[speech.types.SpeechContext(
phrasesHints=["Kita est venu","Vraiment"]
)]
)
Cependant, comme la "lecture" n'est pas donnée, elle n'est pas bien reconnue lorsqu'elle est écrite en kanji. Pardon. Si quelqu'un sait "comment donner une lecture", merci de me le faire savoir m (_ _) m
Manuel officiel https://media.readthedocs.org/pdf/google-cloud-python/latest/google-cloud-python.pdf
Recommended Posts