J'ai créé un réseau neuronal de génération musicale en utilisant mon propre analyseur MIDI et LSTM. Récemment, il y a un projet comme Magenta et il semble être le nième brassage, mais lorsque j'ai modifié la méthode d'échantillonnage à partir de la distribution de probabilité de sortie, un résultat peu intéressant a été obtenu. Je l'ai donc je vais le partager.
Démo (* Notez le volume pour une lecture immédiate) Dépôt
LSTM C'est une sorte de réseau de neurones qui permet d'apprendre le contexte des données séquentielles. Pour plus de détails, je laisse le soin aux nombreux bons articles. Ce qui suit est détaillé.
MIDI(SMF) C'est un format dans lequel les données de performance sont exprimées sous la forme d'une séquence de morceaux avec hauteur, volume, informations de temps, etc. Utilisez (une partie de) cette séquence comme entrée du LSTM.
Quand j'ai essayé de produire des éléments avec une faible probabilité d'occurrence à une certaine fréquence, une chanson avec une chanson originale légèrement arrangée a été générée.
L'analyseur MIDI fait maison est actuellement assez simple, et il y a des morceaux et des informations qui n'ont pas été traités, donc si vous en faites un peu plus, la qualité de la sortie s'améliorera.