[JAVA] NLP4J [006-031] Le traitement de 100 langues frappe avec le verbe NLP4J # 31

Retour à l'index

J'essaierai.

31. verbe

Extraire toutes les formes de surface du verbe.

Maven

Utilisez la version en cours de développement.

<dependency>
	<groupId>org.nlp4j</groupId>
	<artifactId>nlp4j-core</artifactId>
	<version>1.1.1.0-SNAPSHOT</version>
</dependency>

Text Data

Dans l'analyse morphologique (analyse morphologique japonaise de Yahoo! Japan Developer Network) utilisée par défaut, la limite supérieure de la taille de la requête est de 900 Ko et le nombre de fois est limité, donc un petit fichier texte est utilisé.

Java Code

package nlp4j.nokku.chap4;

import java.util.List;

import nlp4j.Document;
import nlp4j.DocumentAnnotator;
import nlp4j.DocumentAnnotatorPipeline;
import nlp4j.Keyword;
import nlp4j.crawler.Crawler;
import nlp4j.crawler.TextFileLineSeparatedCrawler;
import nlp4j.impl.DefaultDocumentAnnotatorPipeline;
import nlp4j.index.DocumentIndex;
import nlp4j.index.SimpleDocumentIndex;
import nlp4j.yhoo_jp.YJpMaAnnotator;

public class Nokku31 {
	public static void main(String[] args) throws Exception {
		//Utilisez le robot d'exploration de fichiers texte fourni par NLP4J
		Crawler crawler = new TextFileLineSeparatedCrawler();
		crawler.setProperty("file", "src/test/resources/nlp4j.crawler/neko_short_utf8.txt");
		crawler.setProperty("encoding", "UTF-8");
		crawler.setProperty("target", "text");
		//Exploration de documents
		List<Document> docs = crawler.crawlDocuments();
		//Définition du pipeline NLP (processus en connectant plusieurs processus en tant que pipeline)
		DocumentAnnotatorPipeline pipeline = new DefaultDocumentAnnotatorPipeline();
		{
			// Yahoo!Annotateur utilisant l'API d'analyse morphologique du Japon
			DocumentAnnotator annotator = new YJpMaAnnotator();
			pipeline.add(annotator);
		}
		//Exécution du traitement des annotations
		pipeline.annotate(docs);
		//Utilisez DocumentIndex pour compter les mots-clés.
		SimpleDocumentIndex index = new SimpleDocumentIndex();
		//Ajouter de la documentation
		index.addDocuments(docs);
		List<Keyword> kwds = index.getKeywords();
		kwds = kwds.stream() //
				.filter(o -> o.getFacet().equals("verbe")) // 品詞がverbe
				.collect(Collectors.toList());
		for (Keyword kwd : kwds) {
			System.err.println(kwd.getStr());
		}
	}
}

résultat

Née
Tsuka
Shi
Pleurs
début
Dire
Vous voyez
Ecoutez
Dire
Dire
Capture
Bouilli
Manger
Dire
Pensées
Chargement
Ascenseur
Shi
Ah
Calmez-vous
Vous voyez
Dire
Pensées
Restant
Mot
Shi
Rencontrer
Rencontrer
Shi
Coup
Gorge
Ku
Faible
boire
Dire
Connaître

Résumé

Avec NLP4J, vous pouvez facilement effectuer le traitement du langage naturel en Java!

URL du projet

https://www.nlp4j.org/ NLP4J_N_128.png


Retour à l'index

Recommended Posts

NLP4J [006-031] Le traitement de 100 langues frappe avec le verbe NLP4J # 31
NLP4J [006-034] 100 coups de traitement de langage avec NLP4J # 34 "A B"
NLP4J [006-033] 100 coups de traitement de langage avec NLP4J # 33
NLP4J [006-032] 100 traitements linguistiques avec NLP4J Knock # 32 Prototype de verbe
NLP4J [006-030] 100 coups de traitement du langage avec NLP4J # 30 Lecture des résultats d'analyse morphologique
NLP4J [006-034c] 100 coups de traitement du langage avec NLP4J # 34 Essayez de résoudre plus intelligemment "A's B" (édition finale)
Noël avec traitement
Présentation de NLP4J- [000] Natural Language Processing Index en Java
Premiers pas avec le traitement Doma-Annotation
Diapositive de présentation réalisée avec Processing