Cette fois, j'ai analysé les données de tweet de ** anglais ** pendant environ un an en utilisant la méthode d'analyse des émotions appelée VADER proposée dans ICWSM-14. Pour VADER, je me suis référé à l'article L'analyse des sentiments est arrivée chez NLTK. Je vous remercie.
VADER VADER est implémenté dans le package de traitement du langage naturel de Python nltk. Essayez de l'utiliser.
In [1]: from nltk.sentiment.vader import SentimentIntensityAnalyzer
In [2]: analyzer = SentimentIntensityAnalyzer()
In [3]: analyzer.polarity_scores("I am happy!!!")
Out[3]: {'compound': 0.6784, 'neg': 0.0, 'neu': 0.179, 'pos': 0.821}
Et "composé", "neg" (nagatif), "neu" (neutre), "pos" (positif) sont émis de 0 à 1.
Tweets en anglais obtenus de l'API Twitter Streaming du 31/10/2014 au 28/10/2015 (je l'ai obtenu de mon senior!). Il y avait 1089358 tweets par jour. Une analyse émotionnelle a été effectuée sur chaque tweet et la valeur de «pos» a été moyennée quotidiennement. De plus, les données finales ont été standardisées de sorte que la moyenne soit de 0 et l'écart type de 1.
Dans un article intitulé Twitter humeur prédit le marché boursier, les résultats suivants ont été obtenus en utilisant OpinionFinder, un outil d'analyse de polarité, et GPOMS, qui analyse six types de facteurs d'émotion. A été obtenu. On s'attend à ce que la valeur de «pos» cette fois soit proche du résultat Happy d'Opinion Finder et de GPOMS.
Les résultats obtenus sont tracés sous forme de graphique chronologique. Faites attention au fait que certaines parties dépassent au-dessus.
Tout le monde est positif lorsqu'il y a un événement pour s'amuser! !! Je voulais analyser la partie où la valeur de "nég" est grande, mais je n'ai pas compris la cause après tout.
Recommended Posts