Essayez le traitement du signal audio avec librosa-Beginner

introduction

L'auteur n'a aucune connaissance du traitement du signal vocal et de la reconnaissance vocale. Cet article n'est pas recommandé aux professionnels sur la route (; ´ ・ ω ・) En passant, je prévois de passer aux niveaux débutant, intermédiaire et avancé.

Motivation

Au travail, une histoire comme "Recommander des chansons!" Est sortie.

La recommandation musicale est-elle classée comme reconnaissance vocale?

La réponse est non. La reconnaissance vocale est le processus par lequel une machine convertit une voix humaine en caractères, de sorte que les recommandations musicales ne sont pas appelées reconnaissance vocale. (Ce site était très facile à comprendre.) La recommandation musicale semble être un domaine de recherche appelé MIR, et le traitement du signal vocal semble en être le cœur.

Qu'est-ce que MIR

Abréviation de MusicInformatioRetrieval. Les données de texte sont entrées pour la recherche de chanson par nom d'artiste ou nom de chanson, qui est généralement utilisé, mais MIR utilise la forme d'onde de la voix elle-même comme entrée.

Ci-dessous un exemple spécifique de MIR

--Recommander la musique qui convient à l'auditeur

Outils et bibliothèques pratiques pour le traitement du signal vocal

J'ai touché les trois ci-dessus, mais pour moi qui suis un débutant dans le traitement du signal vocal, la librosa était meilleure que SPTK. (SPTK était gênant pour créer l'environnement ...) En outre, il est recommandé aux personnes qui souhaitent étudier le traitement du signal vocal tout en étudiant l'apprentissage automatique avec Python. (Bien qu'il soit possible d'écrire SPTK à partir de Python, bien sûr)

C'est pourquoi l'introduction est devenue longue, mais cette fois je présenterai librosa.

(À propos, l'article sur la création d'un système de musique similaire à l'aide de SPTK était trop excellent. Http://aidiary.hatenablog.com/entry/20121014/1350211413)

Installer librosa

J'étais assez impatient car le "jupyter notebook" ne passait pas lors de la construction de l'environnement, je vais donc résumer la procédure.

procédure

    1. Réinstaller Anaconda (probablement pas nécessaire sur Mac ou Linux, je pense que ce n'est pas nécessaire sur Windows si les dernières versions d'Anaconda et Python)
  1. DL de resampy

    1. DL de librosa
  2. Installation du compilateur Microsoft Visual C ++ pour Python 2.7

  3. Ouvrez l'invite de commande Visual C ++ 2008 64 bits et exécutez les commandes suivantes dans chaque répertoire de reampy et librosa

    python setup.py build python setup.py install

En Python

 library(librosa)

Si ça passe, c'est bon

Ancien environnement: Python2.7.11: Anaconda2-4.0.7 Nouvel environnement: Python2.7.12: Anaconda2-4.2.0

Avant de toucher librosa

Voici un résumé de ce que j'ai fait lorsque j'ai commencé à traiter les signaux audio.

図1.gif 図2.gif

Enfin le sujet principal

librosa est un package Python pour l'analyse musicale. Des modules pour MIR sont fournis.

Ce que j'ai fait en me référant au tutoriel librosa

--Visualiser la forme d'onde --Remarque: je l'ai essayé avec librosa, mais finalement j'utilise la wave de la bibliothèque standard Python. ..

à partir de maintenant

--Recueillir «des données d'apprentissage (musique) aussi impartiales que possible».

Impressions

«J'ai essayé de me plonger dans le monde du traitement du signal vocal avec l'intention d'utiliser une arme appelée apprentissage automatique, mais j'étudierai davantage car je n'ai pas assez de connaissances. ――Personnellement, il s'est avéré que la motivation pour étudier était considérablement augmentée lorsque les données d'entrée de l'apprentissage automatique étaient converties en voix. En fait, c'était la plus grande découverte cette fois.

Résumé de l'URL de référence

Merci beaucoup. Veuillez attendre avec impatience la prochaine fois!

Recommended Posts

Essayez le traitement du signal audio avec librosa-Beginner
Traitement du signal acoustique avec Python (2)
Traitement du signal acoustique avec Python
Essayez de produire de l'audio avec M5 STACK
Essayez de gratter avec Python.
Traitement d'image avec MyHDL
Traitement des ensembles de données avec des pandas (1)
Traitement des ensembles de données avec des pandas (2)
Essayez SNN avec BindsNET
Traitement d'image avec Python
Traitement parallèle avec multitraitement
Essayez la régression avec TensorFlow
Traitement d'image avec PIL
Traitement du signal acoustique à partir de Python - Faisons un système acoustique en trois dimensions
Traitement d'image avec Python (partie 2)
100 coups de traitement du langage avec Python 2015
Essayez de défier le sol par récursif
Essayez l'optimisation des fonctions avec Optuna
Incorporer des données audio avec Jupyter
Essayez l'apprentissage en profondeur avec TensorFlow
Traitement parallèle avec des fonctions locales
Traitement d'image avec PIL (Pillow)
Essayez d'utiliser PythonTex avec Texpad.
"Traitement Apple" avec OpenCV3 + Python3
Essayez la détection des bords avec OpenCV
Essayez d'implémenter RBM avec chainer.
Essayez Google Mock avec C
Essayez d'utiliser matplotlib avec PyCharm
Essayez la programmation GUI avec Hy
Essayez Auto Encoder avec Pytorch
Essayez la sortie Python avec Haxe 3.2
Essayez l'opération matricielle avec NumPy
Essayez d'implémenter XOR avec PyTorch
Essayez d'exécuter CNN avec ChainerRL
Essayez différentes choses avec PhantomJS
Essayez le Deep Learning avec FPGA
Traitement parallèle avec Parallel de scikit-learn
Traitement d'image avec Python (partie 1)
Traitement d'image avec Python (3)
Essayez d'exécuter Python avec Try Jupyter
Essayez d'implémenter le parfum avec Go
Essayez Selenium Grid avec Docker
Essayez la reconnaissance faciale avec Python
Essayez OpenCV avec Google Colaboratory
Essayez le machine learning à la légère avec Kaggle
Essayez TensorFlow MNIST avec RNN
Essayez de créer Jupyter Hub avec Docker
Conseils de traitement des données avec Pandas
Essayez d'utiliser le folium avec anaconda
[Python] Traitement d'image avec scicit-image