Une note sur l'exploration de texte.
Divisez une grande quantité de données textuelles en mots et en phrases par traitement du langage naturel ⇒ Auparavant, le langage naturel n'était pas complètement développé et il était difficile de se diviser.
Il a les trois fonctions suivantes.
Supprime le bruit des données textuelles et extrait les informations nécessaires à l'extraction
Extraire des mots par morphologie à l'aide du dictionnaire enregistré Le dictionnaire doit être mis à jour de temps à autre.
Absorbe les fluctuations de notation en créant et en utilisant des dictionnaires de synonymes. Jugez s'il s'agit d'un synonyme en regardant les données. ex) L'évaluation est «élevée» = l'évaluation est «bonne» Le prix est "élevé" ≠ l'évaluation est "bonne"
En extrayant les éléments morphologiques qui apparaissent à proximité, des formes douteuses, des formes négatives et des fluctuations d'expression sont extraites. ex) "Êtes-vous là?" = "Êtes-vous là?" ⇒ verbe + verbe auxiliaire + symbole
Les éléments morphologiques sont regroupés en clauses, et les principales relations de prédicat et les relations de modification entre les clauses sont jugées.
Obtenez de nouvelles informations et connaissances qui correspondent aux informations que vous souhaitez obtenir à partir de l'ensemble des concepts extraits
Calculer la pertinence à partir de la cooccurrence de mots
Divisez les données textuelles en groupes similaires.
Analyser le contexte dans lequel le mot-clé est utilisé ⇒ Est-ce similaire au modèle thématique? ??
Aide à comprendre et à considérer les résultats de l'analyse
Recommended Posts