[JAVA] NLP4J 100 Sprachverarbeitungsklopfen mit NLP4J # 31 Verb

Zurück zum Index

Ich werde es versuchen.

31. Verb

Extrahieren Sie alle Oberflächenformen des Verbs.

Maven

Verwenden Sie die aktuell in der Entwicklung befindliche Version.

<dependency>
	<groupId>org.nlp4j</groupId>
	<artifactId>nlp4j-core</artifactId>
	<version>1.1.1.0-SNAPSHOT</version>
</dependency>

Text Data

In der standardmäßig verwendeten morphologischen Analyse (japanische morphologische Analyse des Yahoo! Japan Developer Network) beträgt die Obergrenze der Anforderungsgröße 900 KB, und die Häufigkeit ist begrenzt, sodass eine kleine Textdatei verwendet wird.

Java Code

package nlp4j.nokku.chap4;

import java.util.List;

import nlp4j.Document;
import nlp4j.DocumentAnnotator;
import nlp4j.DocumentAnnotatorPipeline;
import nlp4j.Keyword;
import nlp4j.crawler.Crawler;
import nlp4j.crawler.TextFileLineSeparatedCrawler;
import nlp4j.impl.DefaultDocumentAnnotatorPipeline;
import nlp4j.index.DocumentIndex;
import nlp4j.index.SimpleDocumentIndex;
import nlp4j.yhoo_jp.YJpMaAnnotator;

public class Nokku31 {
	public static void main(String[] args) throws Exception {
		//Verwenden Sie den von NLP4J bereitgestellten Textdatei-Crawler
		Crawler crawler = new TextFileLineSeparatedCrawler();
		crawler.setProperty("file", "src/test/resources/nlp4j.crawler/neko_short_utf8.txt");
		crawler.setProperty("encoding", "UTF-8");
		crawler.setProperty("target", "text");
		//Dokumentcrawlen
		List<Document> docs = crawler.crawlDocuments();
		//Definition der NLP-Pipeline (Prozess durch Verbinden mehrerer Prozesse als Pipeline)
		DocumentAnnotatorPipeline pipeline = new DefaultDocumentAnnotatorPipeline();
		{
			// Yahoo!Annotator mit Japans API für morphologische Analyse
			DocumentAnnotator annotator = new YJpMaAnnotator();
			pipeline.add(annotator);
		}
		//Ausführung der Annotationsverarbeitung
		pipeline.annotate(docs);
		//Verwenden Sie DocumentIndex, um Schlüsselwörter zu zählen.
		SimpleDocumentIndex index = new SimpleDocumentIndex();
		//Dokumentation hinzufügen
		index.addDocuments(docs);
		List<Keyword> kwds = index.getKeywords();
		kwds = kwds.stream() //
				.filter(o -> o.getFacet().equals("Verb")) // 品詞がVerb
				.collect(Collectors.toList());
		for (Keyword kwd : kwds) {
			System.err.println(kwd.getStr());
		}
	}
}

Ergebnis

Geboren
Tsuka
Shi
Weinen
Start
Sagen
Sie sehen
Hör mal zu
Sagen
Sagen
Fang
Gekocht
Essen
Sagen
Gedanken
Wird geladen
Aufzug
Shi
Ah
Beruhigen
Sie sehen
Sagen
Gedanken
Verbleibend
Mot
Shi
Treffen
Treffen
Shi
Schlag
Kehle
Ku
Schwach
trinken
Sagen
Kennt

Zusammenfassung

Mit NLP4J können Sie ganz einfach die Verarbeitung natürlicher Sprache in Java durchführen!

Projekt-URL

https://www.nlp4j.org/ NLP4J_N_128.png


Zurück zum Index

Recommended Posts

NLP4J 100 Sprachverarbeitungsklopfen mit NLP4J # 31 Verb
NLP4J 100 Sprachverarbeitungsklopfen mit NLP4J # 34 "A B"
NLP4J 100 Sprachverarbeitungsklopfen mit NLP4J # 33
NLP4J 100 Sprachverarbeitung mit NLP4J Knock # 32 Prototyp des Verbs
NLP4J 100 Sprachverarbeitungsklopfen mit NLP4J # 30 Lesen morphologischer Analyseergebnisse
NLP4J 100 Sprachverarbeitungsklopfen mit NLP4J # 34 Versuchen Sie, "A's B" intelligenter zu lösen (endgültige Ausgabe)
Weihnachten mit Verarbeitung
Einführung des NLP4J- [000] Natural Language Processing Index in Java
Erste Schritte mit der Verarbeitung von Doma-Annotationen
Präsentationsfolie mit Verarbeitung erstellt