C'est une histoire très rudimentaire, mais j'ai trouvé quelques points à noter lors de l'utilisation d'une bibliothèque qui peut effectuer une analyse des sentiments.
Concernant TextBlob de la bibliothèque Python, si vous utilisez la méthode -.sentiment de cette bibliothèque, la Polarité et la Subjectivité (Polarité: polarité. Texte) des phrases simples Est positive ou négative. Subjectivité: indépendance. Que l'attitude de l'orateur soit positive ou négative) peut être analysée. Veuillez consulter le rapport analysé sur ici.
Vous pouvez également utiliser la méthode .sentiment pour analyser les tendances dans les livres et le flux de conscience des personnages fictifs, mais le problème est que l'analyse des sentiments de TextBlob est une boîte noire.
Dans Documents officiels, Pattern of the University of Antwerp, Computational Linguistics and Psycholinguistics Il existe un guide qui utilise le module d'exploration de texte et l'ensemble de données, ainsi que le classificateur Naive Bayes de la bibliothèque NLTK. En d'autres termes, si vous ne connaissez pas les sources de ces deux, vous ne pouvez pas comprendre "Pourquoi cette valeur de polarité / indépendance est-elle sortie?" Il semble qu'il sera nécessaire de vérifier quel type de résultat de classification sera obtenu à l'avenir par la méthode .sentiment.
Plus important encore, "la méthode .sentiment de TextBlob ne permet pas l'analyse des traits contextuels." Dans le cadre de la vérification, j'ai écrit 10 lignes de texte contenant des rituels éthiques tels que les 10 commandements de Moïse, et j'ai comparé les textes avec les rituels exactement opposés ...
We must be ethical. We must have the independence of will. We must be based on the concept of duty. We must think universally. We must not tell lies. We must not kill ourselves. We must cultivate our talent very arbitrary. We must be kind to each other. We must preserve our own lives. We must secure our happiness.
We must not be ethical. We must not have the independence of will. We must not be based on the concept of duty. We must not think universally. We must tell lies. We must kill ourselves. We must not cultivate our talent very arbitrary. We must not be kind to each other. We must not preserve our own lives. We must not secure our happiness.
Le résultat est que les deux textes ont presque la même polarité et la même indépendance. J'avais prédit que les synonymes personnels et les verbes auxiliaires modaux, y compris moi-même, tels que «nous» et «devons» augmenteraient la subjectivité, mais apparemment ce n'est pas le cas. Notez également que l'ajout de «non» pour inverser complètement le sens de la phrase ne change pas du tout la polarité ou l'indépendance. En particulier,
- "Nous ne devons pas être éthiques." *
Ces phrases sont également considérées comme des "textes positifs et indépendants".
La méthode .sentiment de TextBlob ne peut analyser qu'une impression abstraite telle que "si le mot utilisé est totalement positif ou non?" Et "La personne qui l'a écrit est-elle vraiment indépendante et positive?" Il s'avère qu'il est inapproprié de connaître un profil spécifique tel que "?". Pour l'utiliser dans ce dernier but, il est nécessaire d'utiliser une autre bibliothèque capable d'analyser les caractéristiques du contexte, ou de saisir dans une certaine mesure le sens des phrases par analyse syntaxique et de l'utiliser pour l'étiquetage. Mon objectif actuel est d'utiliser les caractéristiques des modes de vie éthiques dans les ensembles de données d'apprentissage automatique, je voudrais donc rédiger un autre rapport une fois que j'ai trouvé une bonne solution.
Recommended Posts